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AVANT-PROPOS 


Le présent manuel de la Théorie des probabilités édité en U.R.S.S. 
en 1962 et réédité, complètement remanié, en 1969, est le contenu 
d'un cours qui fut enseigné depuis dix dernières années aux élèves 
des établissements d'enseignement technique supérieur de Moscou. 

L'auteur s'est fixé pour but d'exposer le sujet le plus simplement 
possible et n'a pas jugé utile de se conformer strictement à la trame 
d'une analyse mathématique rigoureuse. 

Certains théorèmes sont présentés sans démonstration: exposé 
sur les limites de confiance et les probabilités de confiance,  théo- 
rème de Kolmogorov sur critère de conformité. 

L'appareil mathématique utilisé ne réclame pas de connaissances 
en mathématiques ne figurant pas aux programmes des Ecoles 
techniques. Là où des notions nouvelles sont introduites (opérateurs 
linéaires, matrices, formes quadratiques, etc.) on fournit des explica- 
tions nécessaires. 

Pour faciliter l'assimilation des différents chapitres du cours 
l'auteur a ajouté à l'exposé de nombreux exercices d'application 
avec les solutions. 

L'auteur sera très reconnaissant au lecteur pour toute remarque 
ou suggestion sur le contenu ou la présentation de cette édition 
française de l'ouvrage. 

Hélène Ventsel 
le 21 avril 1973 


CHAPITRE PREMIER 
INTRODUCTION 


1.1. Objet de la théorie des probabilités 


La théorie des probabilités est une science mathématique étudiant 
les lois régissant les phénomènes aléatoires. On dit qu'un phénomène 
est aléatoire si, reproduit maintes fois, il se déroule chaque fois un 
peu différemment, de sorte que le résultat de l'expérience change 
d'une fois à l'autre d’une manière aléatoire, imprévisible. 

Voici quelques exemples de phénomènes aléatoires. 

1. Une expérience consiste à jeter un dé (un cube à six faces 
portant un, deux, trois, quatre, cinq ou six points) (fig. 1.1.1). 


Fig. 1.1.1 


Le résultat de l'expérience est le nombre de points amenés par le dé. 
En répétant l'expérience plusieurs fois on verra son résultat changer 
d'une manière aléatoire imprévisible. Ces différences sont liées 
à l’action de divers effets, parfois peu importants et même imper- 
ceptibles, intervenant chaque fois que l’on jette le dé et que celui-ci 
tombe surla table, comme, parexemple, l’impulsioninitialécommuni- 
quée au dé, les rugosités de la surface de la table, les vibrations du 
plancher sur lequel se trouve la table, etc.; même lorsque toutes 
les mesures nécessaires à la conservation des conditions de l’expé- 
rience sont prises, on ne peut assurer la stabilité des résultats. 

2. Une expérience consiste en ce que la caisse automatique d'un 
autobus est remplie de pièces de monnaie durant toute la journée. 
On vide cette caisse en fin de journée et l’on compte la recette 
(résultat de l'expérience). Il est clair que ce résultat varie d'un 
jour à l’autre et oscille autour d'une valeur moyenne dans certaines 
limites. Ces variations sont dues à des facteurs aléatoires tels que 
le nombre de voyageurs montés dans l'autobus, le nombre de voya- 
geurs ayant des billets hebdomadaires ou n'en ayant pas, etc. 
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3. Une expérience consiste à peser un certain nombre de fois 
un corps sur une balance automatique. Les résultats des expériences 
répétées ne sont pas rigoureusement constants. Les différences sont 
liées à l’action de nombreux facteurs, comme, par exemple, la posi- 
tion du corps sur le plateau de la balance, les vibrations aléatoires 
de la table, les erreurs d'estimation des indications de l’appareil, 
etc. 

4. Une expérience consiste en ce qu'un avion effectue un vol 
régulier entre deux points. Le temps de vol n'est pas constant d’une 
experience à l’autre mais varie quelque peu. Ces variations (le plus 
souvent ce sont des retards) sont liées’ à l'influence des conditions 
météorologiques sur la ligne aérienne, aux défauts d’appareillage. etc. 

9. On tire d'un engin disposé sous un angle 6 par rapport à l’hori- 
zontale des obus à une vitesse initiale vs, les caractéristiques balisti- 
ques des obus (poids, forme) étant les mêmes. La trajectoire théori- 
que est entièrement déterminée par ces conditions, la trajectoire 
expérimentale s’en écartera obligatoirement à cause des effets secon- 
daires, comme les erreurs de fabrication de l'obus, l’écart du poids 
de sa valeur nominale, l'erreur de mise en place de l'engin, les 
conditions météorologiques, etc. Si plusieurs coups sont tirés dans 
des conditions à première vue similaires, on obtient non pas une 
seule courbe théorique, mais tout un faisceau de trajectoires, don- 
nant la dispersion des obus. 

Tous les exemples mentionnes ci-dessus sont envisagés d'un 
mème point de vue faisant ressortir les variations aléatoires, les 
résultats différents d’une série d'expériences dont les conditions 
essentielles sont maintenues constantes. Toutes ces variations sont 
toujours liées à la présence de facteurs secondaires, influant sur le 
résultat de l'expérience, mais ne figurant pas parmi les conditions 
essentielles. Les conditions essentielles de l'expérience, déterminant 
en gros traits son développement, restent inchangées ; les conditions 
secondaires varient d'une expérience à l’autre et introduisent des 
différences aléatoires dans les résultats. 

Il est évident qu'il n'existe pas, dans la nature, d'effet physique 
libre de tout hasard. Quelque exactes et identiques que soient les 
conditions de l'expérience, il est impossible de faire de telle sorte que 
les résultats coïncident exactement et entièrement. 

Tout phénomène déterministe est inévitablement accompagné 
d'écarts aléatoires. Néanmoins dans certaines applications prati- 
ques, on peut négliger ces éléments aléatoires en remplaçant le 
phénomène réel par un schéma simplifié, son modèle, en supposant 
que dans les conditions données de l'expérience il se déroule d'une 
manière bien déterminée. Parmi la multitude des facteurs interve- 
nant dans le phénomène examiné on sélectionne les plus impor- 
tants, ceux qui sont fondamentaux et décisifs et on néglige tout 
simplement l'influence des autres facteurs. C'est la méthode usuelle 
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d'étude des phénomènes utilisée en physique, en mécanique et dans 
les applications techniques. Selon cette méthode, il s’agit avant tout 
de faire ressortir les conditions les plus importantes du problème 
et de trouver les paramètres qui en sont influencés; l'étape usuelle 
suivante est la mise en équations (on établit et on intègre par ex- 
emple, les équations différentielles décrivant le phénomène). On fait 
ainsi ressortir la loi essentielle régissant le phénomène étudié et per- 
mettant de prévoir le résultat de l’expérience pour des conditions 
données. Avec le progrès scientifique le nombre de facteurs dont 
on tient compte devient de plus en plus important, le phénomène 
est étudié plus en détail, la prédiction scientifique se fait plus 
précise. 

Cependant pour résoudre un certain nombre de problèmes la 
méthode classique des sciences exactes ne peut être utilisée. Il existe 
des problèmes dans lesquels le résultat de l'expérience dépend d'un 
nombre de facteurs si important qu'il est impossible de les enregistrer 
tous -et d'en tenir compte. C'est le cas des problèmes où les facteurs 
aléatoires secondaires intimement liés les uns aux autres jouent 
un rôle important, de plus, leur nombre est tellement grand et leur 
influence si compliquée que l'utilisation des méthodes classiques 
ne saurait être justifiée. 

Considérons un exemple. Supposons que l’on tire sur une cible 
très importante, dont les dimensions sont grandes par rapport au 
domaine de dispersion des obus. Dans ce cas on peut négliger cette 
dispersion et faire simplement coïncider la trajectoire théorique avec 
le centre de la cible. Si au contraire (comme ceci a généralement lieu 
dans la pratique) le domaine de dispersion est supérieur aux dimen- 
sions de la cible, certains obus, sous l'effet des facteurs aléatoires, 
n’atteindront pas la cible. On peut alors se demander: quel est le 
pourcentage moyen des obus atteignant la cible? Quel est le nombre 
des obus qu'il y a lieu de tirer pour détruire la cible avec assez de 
sûreté? Quelles sont les mesures à prendre pour diminuer la dépense 
des obus?, etc. 

Les méthodes des sciences exactes ne permettent pas de répondre 
à ces questions. Pour y répondre on ne peut pas tout simplement 
négliger le hasard, il faut étudier les lois régissant la dispersion 
aléatoire des trajectoires, trouver les causes et le caractère de la 
dispersion. 

Soit un autre exemple. Considérons la recette journalière d'une 
station d'essence. La recette varie d'une manière aléatoire d'un jour 
à l’autre et ceci d'une manière imprévisible. En effet, elle dépend 
du nombre de voitures et de camions arrivés à la station pour faire 
leur plein d'essence, de la quantité d'essence que chacun d'eux 
prendra, du nombre de voitures passant devant la station sans s’y 
arrêter à cause d’une queue trop grande. Néanmoins, malgré le hasard 
il y a lieu de répondre à un grand nombre de questions. Par exemple, 
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quel doit être le nombre de pompes à la station? Quelle doit être 
la réserve de carburant de chaque type? Comment augmenter la 
rentabilité de la station? Et ainsi de suite. 

Ces questions sont intimement liées à la nature aléatoire des 
effets, à l'irrégularité des arrivées, au caractère aléatoire de cha- 
que commande (type de carburant, sa quantité), au hasard dans 
la formation et la dispersion des files d'attente, etc. Pour répondre 
à ces questions il est indispensable d'étudier le travail des stations 
d'essence non pas sous son aspect déterministe, mais compte tenu 
du hasard. 

Soit encore un exemple. Un dispositif technique, par exemple, 
un système de commande automatique, est appelé à résoudre un 
certain problème, en présence de l’action continue de bruits aléatoi- 
res. Les bruits font que le système résout le problème posé avec une 
certaine erreur dépassant parfois la valeur tolérée. Il s’agit de 
déterminer la fréquence d'apparition des erreurs importantes et 
de prévoir les mesures à prendre pour pratiquement exclure leur 
éventualité. 

La réponse à ces questions exige que soient étudiés la nature et la 
structure des perturbations aléatoires agissant sur le système, 
la réponse du système à ces perturbations, le rôle des paramètres 
constructifs du système dans la forme de cette réponse. 

Pour résoudre ces problèmes, très nombreux en physique et en 
technique (tout comme dans d’autres domaines) il y a lieu d'étudier 
non seulement les lois principales déterminant le phénomène dans 
les lignes générales, mais également de procéder à l’analyse des 
perturbations et des déformations aléatoires liées à la présence de 
facteurs secondaires, introduisant une certaine indétermination dans 
le résultat de l'expérience pour des conditions données. 

Quelles sont les méthodes permettant d'étudier les phénomènes 
aléatoires? 

Du point de vue purement théorique, les facteurs, que nous avons 
conventionnellement appelés aléatoires, ne diffèrent en principe 
en rien des autres facteurs, que nous avons appelés essentiels. Théori- 
quement on peut augmenter indéfiniment la précision de la solution 
de chacun des problèmes, tenant compte d’un nombre de plus en 
plus grand de facteurs, des plus importants aux plus insignifiants. 
Néanmoins, une telle étude détaillée et scrupuleuse de l'influence 
de tous les facteurs, dont dépend l’effet, donnerait une solution trop 
compliquée, pratiquement irréalisable, sans augmenter notre con- 
naissance de l'objet. 

Il est évident qu'il doit y avoir une différence de principe dans 
les méthodes permettant de tenir compte des facteurs essentiels, 
déterminant le caractère principal du phénomène, et celles qui 
tiennent compte des facteurs secondaires dont l'influence sur le 
cours du phénomène se manifeste par une erreur ou une perturbation. 
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Le hasard, la complexité, la multitude des causes intervenant dans 
des phénomènes aléatoires rendent nécessaires des méthodes spécia- 
les pour leur étude. 

Ces méthodes sont élaborées dans la théorie des probabilités, 
qui a pour objet d'étude les lois régissant les phénomènes aléatoires. 

L'expérience montre que lorsqu'on observe un grand nombre de 
phénomènes aléatoires, on y décèle généralement des lois tout à fait 
déterminées, en quelque sorte stables. 

Voyons quelques exemples. 

On jette de nombreuses fois une pièce de monnaie; la fréquence 
d'apparition de face pour un grand nombre d'expériences se stabilise 
peu à peu, tendant vers un nombre déterminé qui est dans ce cas 
égal à !/,;. Cette même stabilité des fréquences apparaît également 


Cible 


Fig. 1.1.2 


lorsqu'une expérience quelconque dont l'issuc est aléatoire, indéter- 
minée à l'avance, est répétée de nombreuses fois. Ainsi, par exemple, 
pour un grand nombre de coups tirés, la fréquence de coups atteignant 
le but se stabilise, tendant vers un certain nombre constant. 

Un récipient contient un certain volume de gaz composé par un 
grand nombre de molécules. Chaque molécule s’entrechoque de 
nombreuses fois avec les autres, change de nombreuses fois de vitesse 
et de direction ; donc sa trajectoire est aléatoire. La pression du gaz 
sur les parois du récipient est due à l’ensemble des chocs des molé- 
cules contre les parois. 11 pourrait sembler que si la trajectoire de 
chaque molécule est aléatoire, la pression sur les parois du récipient 
devrait également changer d'une manière aléatoire et incontrôlable, 
mais il n'en est rien. Si le nombre de molécules est suffisamment 
important, la pression du gaz ne dépend pratiquement pas des trajec- 
toires des différentes molécules et suit une loi déterminée et très 
simple. Les particularités aléatoires propres au mouvement de 
chaque molécule se trouvent compensées dans leur ensemble de 
sorte que, malgré la complexité de chaque phénomène aléatoire 
particulier, on obtient une loi très simple, vraie pour leur ensemble. 
Notons que c’est justement la multitude des phénomènes aléatoires 
qui donne lieu à une loi déterminée; lorsque le nombre de molécules 
est restreint. on voit apparaître des écarts aléatoires, appelés fluctua- 
tions. 
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Des coups sont tirés les uns après les autres sur une cible: on 
étudie la répartition des points d'atteinte. Lorsque le nombre de 
coups est faible, les points d'atteinte sont répartis d'une manière 
désordonnée, sans qu'aucune loi se manifeste. Quand le nombre de 
coups augmente, on voit apparaître une certaine loi dans la disposi- 
tion des points d'atteinte; cette loi est d'autant plus nette que le 
nombre de coups est important. La disposition des points d'atteinte 
est à peu près symétrique par rapport à un certain point central: 
dans la zone centrale les trous sont bien plus denses que sur les 
bords ; la densité des trous décroît suivant une loi déterminée (cette 
loi est appelée loi normale ou loi de Gauss, et nous l’étudierons en 
détail dans notre cours). 

Des lois spécifiques, dites s{atistiques, sont observées chaque fois 
que nous avons affaire à des effets aléatoires se produisant en grand 
nombre. Les lois apparaissant dans l’ensemble de phénomènes sont 
pratiquement indépendantes des particularités individuelles des 
composantes. Ces particularités se compensent dans la masse et le 
résultat moyen n'est plus pratiquement aléatoire. C'est cette sta- 
bilité, confirmée par l'expérience, qui légitime l’utilisation des 
méthodes probabilistes (statistiques) d'étude. Les méthodes de la 
théorie des probabilités sont de par leur nature adaptées à l'étude 
des phénomènes aléatoires dans leur ensemble, sans donner aucune 
idée sur le résultat d’une quelconque expérience aléatoire. 

Plus grand est le nombre d'expériences aléatoires identiques 
étudiées dans un problème, plus nettes sont les lois inhérentes au 
phénomène, plus grandes sont la précision et la certitude des pré- 
visions. 

Dans tous les cas où l'on applique les méthodes probabilistes 
on tend à éviter l'étude trop compliquée (et parfois pratiquement 
impossible) d'un effet isolé, conditionné par un très grand nombre de 
facteurs, et on entreprend l'étude des lois régissant le phénomène 
aléatoire dans son ensemble. L'étude de ces lois permet non seule- 
ment de faire des prévisions scientifiques dans un domaine très 
particulier de phénomènes aléatoires, mais également de diriger 
le cours des processus aléatoires, de les contrôler, de limiter lechamp 
d'action du hasard, de réduire son influence pratique. 

La méthode probabiliste ou statistique d'étude ne s'oppose pas 
à la méthode classique, mais la complète, permettant d'analyser plus 
en détail le phénomène, compte tenu du hasard. 

Le développement actuel des sciences naturelles et techniques 
est caractérisé par l'utilisation globale et fructueuse des méthodes 
statistiques. C'est tout naturel, car l’étude détaillée d’un phénomène 
quelconque ne peut se borner à celle des lois essentielles, il arrive 
un moment où il y a lieu d'analyser les écarts éventuels. Des branches 
entières de la physique moderne (en particulier la physique nucléaire) 
sont basées sur les méthodes de la théorie des probabilités. Les métho- 
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des probabilistes sont de plus en plus courantes en électrotechnique 
et radiotechnique modernes, en météorologie et astronomie, dans 
la théorie de commande automatique et dans la programmation, 
dans les problèmes économiques, sociaux, militaires, . etc. 

Les lois mathématiques de la théorie des probabilités reflètent 
les lois statistiques réelles. Les méthodes mathématiques efficaces 
et rigoureuses, mises en œuvre par la théorie des probabilités pour 
l'étude des phénomènes aléatoires, en font une branche mathématique 
aussi logique et précise que les autres sciences mathématiques. 


1.2. Bref aperçu historique 


La théorie des probabilités, comme beaucoup d'autres sciences 
mathématiques, est née des besoins pratiques. 

C'est au XVII siècle que commence l'étude systématiqhe- des 
problèmes liés aux phénomènes aléatoires et où l’on voit apparaître 
l'appareil mathématique correspondant. Au début du XVIIe siècle 
l'éminent physicien Galilée essaie déjà d'étudier les erreurs des 
mesures physiques, considérant celles-ci comme aléatoires et esti- 
mant leur probabilité. À cette époque apparaît également la théorie 
des assurances, basée sur l'analyse des lois régissant des phénomènes 
aléatoires tels que la morbidité, la mortalité, les accidents, etc. 
La nécessité d’un appareil mathématique apte à analyser les phéno- 
mènes aléatoires se fait sentir dans toutes les sciences où le traite- 
ment et la généralisation d'un grand nombre de données statistiques 
posaient des problèmes assez difficiles. 

Cependant la théorie des probabilités en tant que science mathé- 
matique a été fondée non pas sur les problèmes pratiques mentionnés 
qui sont pourtant trop compliqués pour qu'on puisse en dégager les 
lois. I1 a fallu tout d'abord étudier les manifestations du hasard 
plus simples. L'étude systématique a commencé par les jeux de 
hasard. Depuis des temps très anciens ces jeux ont été créés par des 
générations entières de telle sorte que l'issue de l'expérience ne 
dépende pas des conditions de l'expérience et soit purement aléatoire. 
Les jeux de hasard fournissent des modèles particulièrement simples 
et clairs de phénomènes aléatoires, permettant dans la forme la plus 
pure d'observer et d'étudier les lois spécifiques les régissant; de 
plus, la possibilité de répéter de nombreuses fois une même expé- 
rience assure une vérification expérimentale de ces lois dans les 
conditions réelles des expériences répétées. Jusqu'à présent les 
exemples empruntés aux jeux de hasard et les problèmes analogues 
dits de « tirage exhaustif » sont utilisés dans tous les manuels trai- 
tant de la théorie des probabilités en tant que modèles simplifiés des 
phénomènes aléatoires. 

La naissance d'une véritable théorie des probabilités au sens 
moderne du terme peut être située vers 1650, avec les travaux de 
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Fermat (1601-1665), Pascal (1623-1662) et Huygens (1629-1695) 
consacrés à la théorie des jeux de hasard. Dans ces travaux on voit 
se former peu à peu les notions importantes de probabilité et d'espé- 
rance mathématique; leurs propriétés essentielles ont été établies 
ainsi que les méthodes de leur calcul. Les méthodes probabilistes 
ont avant tout été utilisées dans les problèmes d'assurance. Dès 
la fin du XVIIe siècle les assurances se trouvent basées sur des métho- 
des scientifiques. Plus tard la théorie des probabilités a pénétré dans 
d'autres domaines. 

Les travaux de Jacob Bernoulli (1654-1705) font un pas en avant 
dans le développement de la théorie des probabilités. On lui doit 
la démonstration de la loi fondamentale de la théorie des probabili- 
tés, appelée loi des grands nombres. 

Avant Bernoulli on a remarqué une particularité des phénomènes 
aléatoires que l'on peut appeler « stabilité des fréquences pour un 
grand nombre d'expériences » et qui se manifeste en ce que pour un 
grand nombre d'expériences, ayant chacune une issue aléatoire, la 
fréquence relative d'apparition de chacune des issues tend à se sta- 
biliser, convergeant vers un certain nombre, la probabilité de cette 
issue. Par exemple, si l’on jette un grand nombre de fois une pièce 
de monnaie, la fréquence relative d'apparition de face tend vers !/.; 
de même, lorsque l'on jette un grand nombre de fois un dé à six 
faces, la fréquence d'apparition de cinq points tend vers !,,, etc. 
Jacob Bernoulli était le premier à donner le fondement théorique 
de ce fait empirique. Le théorème de Jacob Bernoulli est la forme 
la plus simple de la loi des grands nombres, il établit une relation 
entre la probabilité d'un événement et la fréquence de son appari- 
tion ; lorsque le nombre d'expériences est suffisamment important, 
on peut s'attendre, avec une certitude élevée, à ce que la fréquence 
s'approche aussi près que l'on veut de la probabilité. 

Une autre étape importante dans le développement de la théorie 
des probabilités est liée au nom de Moivre (1667-1754). C'est lui 
qui a introduit et démontré. pour le cas le plus simple, une loi parti- 
culière. observée souvent dans les phénomènes aléatoires, appelée 
loi normale (ou loi de Gauss). Comme nous allons le voir, la loi 
normale joue un rôle particulièrement important dans les phénomè- 
nes aléatoires. Le groupe de théorèmes donnant un fondement à cette 
loi pour différentes conditions porte le nom général de « théorème 
central limite ». 

Puis vinrent Laplace (1749-1827), Gauss (1777-1855), Poisson 
(1781-1840). Laplace a donné un: exposé concis et systématique des 
fondements de la théorie des probabilités, démontré une des formes 
du théorème central limite (théorème de Moivre-Laplace) et développé 
de noinbreuses applications remarquables de la théorie des probabili- 
tés aux questions pratiques. en particulier à l’analyse des erreurs 
d'observations et de mesures. 
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Gauss a donné un fondement encore plus sérieux à la loi normale, 
il a élaboré une méthode de traitement des données expérimentales 
appelée « méthode des moindres carrés ». Poisson a démontré une 
forme, plus générale que celle de Bernoulli, de la loi des grands nom- 
bres, et le premier a appliqué la théorie des probabilités aux problè- 
mes du tir. Une des lois de répartition, jouant un rôle particulière- 
ment important en théorie des probabilités et dans ses applications, 
porte le nom de Poisson. 

Le XVIIIe siècle et le début du XIX° siècle sont caractérisés 
par un développement intense de la théorie des probabilités ; à cette 
époque celle-ci devient à la mode. On l'utilise non seulement là où 
elle est applicable de droit, mais également là où elle n'est pas justi- 
fiée, comme, par exemple, dans les sciences morales. Un grand nombre 
de travaux virent le jour où la théorie des probabilités était appliquée 
au droit, à l’histoire, à la politique et même à la théologie. Dans 
tous ces travaux pseudo-scientifiques on perçoit une conception 
simplifiée, mécaniste des phénomènes sociaux. Des probabilités 
arbitraires se trouvaient à la base des raisonnements (par exemple. 
dans les questions de droit, on supposait que les gens mentent ou 
disent la vérité avec une probabilité égale pour tous); ceci posé, 
le problème social se résolvait comme un simple problème arithmé- 
tique. Il est évident que toutes ces tentatives étaient vouées à l'échec 
et ne pouvaient jouer un rôle positif dans le développement scienti- 
fique. Au contraire, le résultat indirect en a été que vers 1920-1930 la 
passion générale pour la théorie des probabilités s'est tournée en 
déception et scepticisme. Aux yeux du grand public elle est devenue 
une science douteuse, une sorte de distraction mathématique, non 
digne d'une étude sérieuse. 

Il est remarquable que justement à cette époque apparaît célèbre 
école mathématique de Saint-Pétersbourg ayant donné à la théorie 
des probabilités son fondement logique et théorique et en ayant fait 
un outil efficace, exact et fiable de la connaissance. Dès la naissance 
de cette école le développement de la théorie des probabilités se 
trouve étroitement lié aux travaux des savants russes et soviétiques. 

Parmi les savants de l'école mathématique de Saint-Pétersbourg 
il faut citer V. Bouniakovski (1804-1889) à qui l’on doit le premier 
cours de théorie des probabilités en langue russe, la terminologie 
russe de la théorie des probabihtéset des travaux intéressants sur 
la statistique et la démographie. 

À P. Tchébychev (1821-1894), éminent mathématicien russe, 
élève de V. Bouniakovski, on doit l'extension ultérieure et la géné- 
ralisation de la loi des grands nombres ; de plus, il a introduit dans 
la théorie des probabilités la méthode puissante et féconde des 
moments. 

A. Markov (1856-1922), élève de P. Tchébychev, a également 
enrichi la théorie des probabilités de découvertes et de méthodes fort 


16 INTRODUCTION [CH. 1 


importantes. A. Markov a etendu le domaine d'application de la 
loi des grands nombres et du théorème central limite aux expériences 
indépendantes et dépendantes. Le mérite essentiel de A. Markov est 
d'avoir jeté les bases d'une branche nouvelle de lathéorie des 
probabilités, à savoir de la théorie des processus aléatoires ou sto- 
chastiques. 

Au nom de A. Liapounov (1857-1918), qui était aussi un élève 
de P. Tchébychev, est liée la première démonstration du théorème 
central limite pour des conditions très générales. Pour démontrer 
son théorème À. Liapounov a élaboré la méthode spéciale des fonc- 
tions caractéristiques, couramment utilisée de nos jours dans la 
théorie des probabilités. 

Ces dernières décennies la théorie des probabilités est devenue 
l’une des sciences en plein essor, étroitement liée aux besoins pra- 
tiques et techniques. L'école probabiliste soviétique qui a hérité des 
traditions de l'école mathématique de Saint-Pétersbourg se trouve 
au premier plan de la science moderne. 

Nous ne citerons ici que quelques-uns des éminents savants 
soviétiques dont les travaux ont joué un rôle décisif dans le dévelop- 
pement de la théorie moderne des probabilités et de ses applications 
pratiques. 

S. Bernstein (1880). a élaboré un système complet d'axiomes 
de la théorie des probabilités et a étendu le domaine d'application 
des théorèmes limites. 

A. Khintchine (1894-1959) est bien connu pour ses tra- 
vaux de généralisation et de renforcement de la loi des grands 
nombres, et surtout pour ses études des processus aléatoires sta- 
tionnaires. 

Un grand nombre de travaux fondamentaux dans différents 
domaines de la théorie des probabilités et de la statistique mathe- 
matique appartiennent à A. Kolmogorov (1903). C'est lui qui a cor- 
rectement axiomatisé la théorie des probabilités en faisant ressortir 
ses liens avec une branche importante de l'analyse, à savoir la théorie 
métrique des fonctions. Les travaux de Kolmogorov sur la théorie 
des fonctions aléatoires (processus stochastiques) se trouvent actuelle- 
ment à la base des études dans ce domaine et sont particulièrement 
importants. Ses travaux sur l'estimation de l'efficacité sont à la 
base d'une branche nouvelle de la théorie des tirs, devenue la science 
générale de l'efficacité des opérations militaires. 

V Romanovski (1879-1954) et N. Smirnov sont connus pour 
leurs travaux de statistique mathématique, E. Sloutski (1880-1948) 
pour ses travaux sur la théorie des processus aléatoires, B. Gnédenko 
s’est consacré à l'étude des systèmes d'attente, E. Dynkine à l'étude 
des processus aléatoires markoviens, V. Pougatchev a beaucoup 
apporté à la théorie des processus aléatoires appliquée aux problè- 
mes de commande automatique. 
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La théorie des probabilités est à l'heure actuelle en plein essor. 
Un intérêt particulier est porté aux questions relatives aux processus 
stochastiques. Des travaux importants dans ce domaine appartien- 
nent à N. Wiener, W. Feller, J. Doob. Il y a lieu également de noter 
les travaux intéressants de R. Fisher, J. Neumann et H. Cramer sur 
la statistique mathématique et la théorie de commande automa- 
tique. 

Ces dernières années on voit apparaître de nouvelles méthodes 
de la théorie des probabilités appliquée. Il s’agit en particulier de 
nouvelles disciplines, telle que la théorie de l'information et la 
théorie des systèmes d'attente. Nées des besoins pratiques, ces nou- 
velles branches acquièrent une importance théorique générale, leur 
domaine d'application ne cessant de s'étendre. 


CHAPITRE 2 


NOTIONS FONDAMENTALES 
DE LA THÉORIE DES PROBABILITÉS 


2.1. Evénement. Probabilité d’un événement 


Toute science développant la théorie générale d'un ensemble 
de phénomènes fait usage d'un certain nombre de notions fondamen- 
tales. Par exemple, en géométrie ce sont les notions de point, de 
droite, de ligne; en mécanique les notions de force, de masse, de 
vitesse, d'accélération, etc. Il est évident que toutes ces notions ne 
peuvent être définies en toute rigueur, car définir une notion signifie 
la rapporter à d’autres, plus connues. On conçoit aisément que le 
processus de définition de ces notions les unes par les autres doit 
s'arrêter quelque part, ayant abouti aux notions primaires auxquelles 
reviennent toutes les autres et qui sont elles-mêmes non pas définies, 
mais seulement précisées. 

De telles notions de base existent également en théorie des pro- 
babilités. Nous allons commencer par introduire la notion d'événe- 
ment. 

En théorie des probabilités on entend par événement tout fait 
pouvant être réalisé ou ne pas être réalisé par une expérience. 

Citons quelques exemples d'événements: 

A — l'apparition de face lorsque l'on jette une pièce de monnaie; 

B — l'apparition de face trois fois de suite lorsqu'on jette une 

pièce de monnaie trois fois; 

C — l'atteinte d'une cible lorsqu'on tire un coup: 

D — le tirage d'un as dans un jeu de cartes; 

E — la détection d'un objectif dans un cycle d'exploration d’une 

station radar; 

F — la rupture d'un fil pendant une heure de fonctionnement 

d'un métier à tisser. 

En examinant les événements mentionnés ci-dessus on voit que 
chacun d'eux est en une certaine mesure plus ou moins probable; 
pour certains de ces événements on peut dire immédiatement lequel 
est plus probable et lequel l’est moins. Par exemple, on voit tout 
de suite que l'événement À est plus probable que P et D. Il n'en est 
pas de même pour les événements C, Æ et F, à cet effet il y aurait 
lieu de préciser les conditions de l'expérience. Il est évident que 
pour comparer quantitativement entre eux les événements suivant 
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leur possibilité de réalisation, il faut associer à chaque événement 
un certain nombre qui est d'autant plus grand que la possibilité 
de réalisation est plus élevée et que nous appellerons probabilité 
de l'événement. 

Nous avons ainsi introduit la seconde notion fondamentale de la 
théorie des probabilités. La probabilité d’un événement est la mesure 
numérique de la possibilité effective de cet événement. 

Notons que dès l'introduction de la notion de probabilité d'un 
événement, celle-ci est douée d'un sens pratique ;eneffet, en se basant 
sur l'expérience on considère qu’un événement est plus probable s'il 
se produit plus souvent et moins probable s'il est plus rare et peu 
probable s'il n'apparaît presque jamais. Ainsi, la notion de probabi- 
lité d un événement est liée à la notion pratique de fréquence d'un 
événement. 

Pour comparer entre eux différents événements suivant leur 
éventualité, on doit disposer d’une unité de mesure. Pour unité 
de mesure il est tout naturel de prendre la probabilité d’un événe- 
ment certain, c'est-à-dire d’un événement qui doit obligatoirement 
se produire dans 1 expérience. A titre d'exemple d'événement certain 
on peut citer le fait qu'un jet d’un dé n’amène pas plus de six points. 

Si lon attribue à l'événement certain une probabilité égale 
à l'unité, tous les autres événements, probables mais non certains, 
seront caractérisés par des probabilités inférieures à l'unité. 

L'événement contraire de l’événement certain est appelé événe- 
ment impossible, c'est un événement qui ne peut pas se produire dans 
l'expérience en question. À titre d'exemple d'événement impossible 
on peut citer l'apparition de douze points lorsqu'on jette un dé. 
Il est naturel d’attrihuer à l'événement impossible une probabilité 
égale à zéro. 

Nous avons ainsi établi l'unité de mesure des probabilités, 
à savoir la probabilité de l'événement certain, et la gamme de varia- 
tion des probabilités de tous les événements, les nombres de 0 à 1. 


2.2. Calcul direct des probabilités 


Pour toute une classe d'expériences, les probabilités des résultats 
éventuels peuvent facilement être estimées directement à partir des 
conditions de l'expérience. Pour cela il faut que les différents résul- 
As des expériences soient symétriques et par conséquent équipro- 
ables. 

Considérons par exemple une expérience consistant à jeter un dé, 
c'est-à-dire un cube symétrique sur les faces duquel sont portés 1, 
2, 3, 4, 5 et 6 points. 

Vu la symétrie du dé, il y a lieu de considérer tous les six résultats 
de l'expérience équiprobables. C'est ce qui nous donne le droit de 
supposer que lorsqu'on jette un dé de nombreuses fois toutes les 
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six faces sortiront un même nombre de fois. Pour un dé bien équilibré 
cette hypothèse est vérifiée par l'expérience; lorsqu'on jette un dé 
un grand nombre de fois chacune de ses faces apparaît à peu près 
une fois sur six, l'écart par rapport à la valeur 1/, est d'autant plus 
petit que le nombre d'expériences est important. Comme la proba- 
bilité d’un événement certain est égale à l'unité, il est tout naturel 
d'attribuer la probabilité !/, à l'apparition de chacune des faces. 
Ce nombre caractérise les propriétés effectives du phénomène aléatoi- 
re étudié, à savoir la symétrie des six résultats possibles de l’expé- 
rience. 

Ainsi, pour toutes les expériences dont les résultats possibles sont 
symétriques et équiprobables, on peut appliquer une méthode ana- 
logue appelée calcul direct des probabilités. 

En général, on ne peut observer une symétrie dans les résultats 
éventuels des expériences que si ces dernières sont artificielles, 
comme dans le cas des jeux de hasard. La théorie des probabilités 
ayant été développée justement sur la base des jeux de hasard, la 
méthode de calcul direct des probabilités apparue en même temps 
que la théorie des phénomènes aléatoires, a été durant très longtemps 
considérée comme fondamentale, c'est sur elle que se basait la théo- 
rie « classique » des probabilités. Les expériences qui ne possédaient 
pas la symétrie des résultats possibles ont été rapportées artificielle- 
ment au schéma classique. 

Bien que le domaine d'application pratique de ce schéma soit 
limité, il présente un certain intérêt, car les expériences à résultats 
éventuels symétriques et les événements liés à ces expériences, per- 
mettent de mieux comprendre les propriétés essentielles des probabi- 
lités. Nous allons tout d’abord étudier les événements de ce genre 
auxquels peut s'appliquer le schéma de calcul direct des proba- 
bilités. 

A cet effet nous introduisons certaines notions auxiliaires. 

1. Système complet d'événements. 

On dit que plusieurs événements forment un système complet 
d'événements si, dans une expérience, un événement et un seul du 
système est réalisé à la fois. 

À titre d'exemple d'événements formant un système complet on 
peut citer: 

1) l'apparition de pile ou de face lorsqu'on jette une pièce de 
monnaie : 

2) un coup porté ou un coup raté lors d'un tir; 

3) l'apparition de 1, 2, 3, 4, 5, 6 points dans le jet d'un dé: 

&) le tirage d’une boule blanche ou d’une boule noire lorsque 
l'on tire une boule d'une urne contenant par exemple 2 boules blan- 
ches et 3 boules noires: 

5) zéro, une, deux, trois ou plus d'erreurs d'impression dans une 
page d'épreuve ; 


te 
to 
2 
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6) de deux coups tirés au moins un coup atteignant le but ou 
un coup rate. 

2. Evénements incompatibles. 

Des événements sont dits incompatibles dans une experience si 
aucuns deux d'entre eux ne peuvent apparaître simultanément. 

A titre d'exemple d'événements incompatibles on peut citer: 

1) l’apparition simultanée de pile et de face lorsqu'on jette une 
pièce de monnaie; 

2) atteindre et rater simultanément une cible par un seul coup; 

3) l'apparition de 1, 2, 3 points simultanément lors du jet d'un dé ; 

4) exactement une, deux, trois pannes simultanées d'un disposi- 
tif technique pour 10 heures de fonctionnement. 

3. Evénements équiprobables. 

Plusieurs événements dans une expérience sont dits équiprobables 
si la symétrie donne lieu de supposer qu'aucun de ces événements 
n'est plus probable qu'un autre. 

A titre d'exemple d'événements équiprobables on peut citer: 

1) l'apparition de pile et de face lorsqu'on jette une pièce de 
monnaie ; 

2) l'apparition de 1, 2, 3, 4, 5, 6 points quand on jette un dé; 

3) le tirage d'un carreau, d'un cœur, d'un trèfle ou d’un pique 
dans un jeu de cartes; 

4) le tirage d’une boule portant le n° 1, 2, 3, . .. lorsqu'on tire 
des boules d’une urne contenant 10 boules numérotées. 

Il existe des événements doués des trois propriétés mentionnées ; 
ils forment un système complet, sont incompatibles etéquiprobables ; 
par exemple, l'apparition de pile ou de face lorsqu'on jette une pièce 
de monnaie; l’apparition de 1, 2, 3, 4, 5, 6 points lorsqu'on jette 
un dé. Les événements formant un tel groupe sont dits des cas. 

Pour une expérience à résultats éventuels symétriques, les cas 
forment un système exhaustif de résultats équiprobables et mutuelle- 
ment incompatibles. On dit qu'une telle expérience se réduit à un 
« système de cas» ou encore, à un «tirage exhaustif ». 

Le plus souvent on rencontre des systèmes de cas dans les expé- 
riences artificielles, dans lesquelles l’équiprobabilité des résultats est 
assurée d'avance (comme par exemple, dans les jeux de hasard). 
Dans de telles expériences on peut directement calculer la probabilité 
en estimant le nombre des cas favorables parmi tous les cas possibles. 

Un cas est dit favorable à un événement si son apparition entraîne 
la réalisation de l'événement en question. 

Par exemple, lorsque l’on jette un dé, six cas sont possibles: 
apparition de 1, 2, 3, 4, 5, 6 points. Si l'événement À consiste en 
l'apparition d’un nombre pair de points, les cas de 2, 4, 6 points 
sont favorables, les trois autres étant défavorables. 

Si une expérience se réduit à un système de cas, la probabilité 
de l'événement À dans cette expérience peut être estimée comme la 
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proportion des cas favorables. La probabilité P (4) de l'événement À 
se calcule comme le rapport du nombre m de cas favorables au nom- 
bre nr de tous les cas possibles: 


P(4)=—. (2.2.1) 


Le nombre de tous les cas favorables se trouvant toujours entre 0 et 
n (0 pour l'événement impossible et x pour l'événement certain), 
la probabilité de l'événement calculée par la formule (2.2.1) est 
toujours une fraction rationnelle propre: 


0<P(4)<1. (2.2.2) 


La formule (2.2.1) dite « formule classique » de calcul des pro: 
babilités, a longtemps servi à définir la probabilité. A l'heure 
actuelle on se base, généralement, sur d’autres principes, liant directe- 
ment la notion de probabilité à la notion empirique de fréquence 
relative; quant à la formule (2.2.1), elle s'est conservée comme une 
formule de calcul direct des probabilités quand l'expérience se 
réduit à un système de cas, c'est-à-dire lorsque les issues possibles 
de l'expérience sont équiprobables. 


Exemple 1. Une urne contient 2 boules blanches et 3 noires. On tire 
au hasard une boule de l’urne. Trouver la probabilité de tirer une boule blanche. 

Solution. Nous allons désigner par À l'événement correspondant au 
tirage d’une boule blanche. Le nombre des cas possibles est nr — 5; le nombre 
des cas favorables à l'événement À est m = 2. Par conséquent: 


2 

P (4) = ru 

Exemple 2 Une urne contient a boules blanches et b boules noires. 

ou re deux boules de l’'urne. Trouver la probabilité de tirer deux boules 

anches. 

Solution. Désignons par B l'événement correspondant au tirage de 

deux boules blanches. Calculons le nombre total des cas possibles n et le nombre 
m des cas favorables à l'événement B: 


a+b' 
m=Cie), 
par conséquent. 
2 
a 
P(B)= ITR 


Exemple 3. Dans un lot’de NW pièces. M sont défectueuses. On prend 
dans ce lot r pièces au hasard. Trouver la probabilité pour que, parmi n pièces, 
on trouve exactement m défectueuses. 


*) Le signe C: désigne le nombre de combinaisons de k éléments pris Z à L. 
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Solution. Le nombre total des cas est de toute évidence égal à C\; 


le nombre des cas favorables est CHCN_'m d'où la probabilité de l'événement 


qui nous intéresse 
nm 


P (4)=— "NM on 


2.3. Fréquence relative, ou probabilité statistique 
d'un événement 


La formule (2.2.1) pour le calcul direct des probabilités n'est 
applicable que si l’expérience pouvant réaliser l'événement qui nous 
intéresse a des issues possibles symétriques (se réduit à un système 
de cas). Il est clair que toutes les expériences ne peuvent pas se 
réduire à un système de cas, et il existe une classe importante d'évé- 
nements dont les probabilités ne peuvent pas être calculées par la 
formule (2.2.1). Considérons, par exemple, un dé mal équilibré. 
L'apparition de telle ou telle face n'est plus alors caractérisée par 
la probabilité 1/,; on comprend intuitivement que pour ce dé 
mal équilibré l'apparition de la face défectueuse possède une certaine 
probabilité, indiquant la fréquence moyenne d’apparitions de cette 
face lorsque le dé est jeté de nombreuses fois. De même, les probabili- 
tés d'événements tels que l'atteinte de la cible lors d’un coup, le 
défaut d'un tube électronique durant une heure de fonctionnement 
ou l'apparition du signal « occupé » sur un appel téléphonique ne 
peuvent pas non plus être calculées à l’aide de la formule (2.2.1), 
car les expériences correspondantes ne se réduisent pas à un système 
de cas. Cependant il est évident que chacun des événements énumérés 
possède une certaine possibilité effective, qui en principe peut être 
calculée numériquement et qui, si l’on multiplie ces expériences, 
sera donnée par la fréquence relative des événements correspondants. 
Nous allons supposer alors que chaque événement lié à un grand 
nombre d'expériences homogènes, se réduisant ou non à un système 
de cas, a une certaine probabilité se trouvant entre zéro et l'unité. 
Pour les événements se réduisant à un système de cas cette probabilité 
peut être calculée directement à l’aide de la formule (2.2.1). Pour 
les événements qui ne se réduisent pas à un système de cas on utilise 
d'autres méthodes. Toutes ces méthodes ont leurs racines dans 
l'expérience et pour s'en faire une idée il y a lieu de préciser la notion 
de fréquence d'un événement et le caractère particulier de la relation 
existant entre la probabilité et la fréquence. 

Soit une série de nr expériences chacune desquelles peut réaliser 
ou ne pas réaliser un certain événement À. On appelle fréquence 
de l'événement À dans la série d'expériences en question le rapport 
du nombre d’ expériences où l'événement À est apparu, au nombre 
total d'expériences effectuées. 
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La fréquence d’un événement est souvent appelée sa probabilité 
statistique, ou.empirique, à la différence de la probabilité mathémati- 
que introduite ci-dessus. 

Nous désignerons par P* (4) la fréquence (la probabilité statisti- 
que) de l'événement À. La fréquence d’un événement est calculée 
à partir des résultats des expériences par la formule suivante: 


P*(4)= +, (2.3.1) 


où m est le nombre d'apparitions de l'événement À: 

n le nombre total d'expériences. 

Lorsque le nombre d'expériences n'est pas important la fréquence 
de l'événement a un caractère aléatoire et peut notablement changer 
d'un groupe d'expériences à l’autre. Par exemple, si l’on jette une 
pièce de monnaie 10 fois, il est fort probable que face apparaisse 
deux fois seulement (la fréquence d'apparition de face sera alors 
égale à 0,2); dix autres coups peuvent amener face huit fois (fré- 
quence 0,8). Cependant lorsque le nombre d'expériences augmente 
la fréquence de l'événement perd son caractère aléatoire ; les condi- 
tions aléatoires intervenant dans chaque expérience isolée se trou- 
vant mutuellement compensées et la fréquence tend à se stabiliser, 
s'’approchant d'une certaine grandeur constante. Par exemple, 
lorsqu'on jette une pièce de monnaie un grand nombre de fois, la 
fréquence d'apparition de face s’écartera peu de 1/2. 

Cette « stabilité des fréquences », vérifiée maintes fois par les 
observations et confirmée par toute l'expérience humaine est une 
des lois les plus caractéristiques des phénomènes aléatoires. Cette 
loi a été formulée pour la première fois par J. Bernoulli dans le 
théorème portant son nom et représentant en fait une forme simple 
de la loi des grands nombres. J. Bernoulli a démontré que pour un 
grand nombre d'expériences homogènes indépendantes on peut affir- 
mer avec certitude que la fréquence d’un événement différera aussi 
peu que l’on veut de sa probabilité dans une expérience isolée. 

Le lien existant entre la fréquence d'un événement et sa probabi- 
lité est très profond. Ces deux notions sont pratiquement insépara- 
bles. En effet, lorsqu'on estime la probabilité d’un événement, 
on se base forcément sur la fréquence des événements analogues dans 
la pratique. En caractérisant la probabilité d’un événement par un 
nombre quelconque on ne peut attribuer à ce nombre une autre valeur 
réelle et une autre signification que la fréquence relative d'appari- 
tion de l'événement en question dans un grand nombre d'expériences. 
L'estimation numérique de l'éventualité d’un événement par la 
probabilité n'a de sens pratique que parce que les événements plus 
probables se produisent en moyenne plus souvent que les moins 
probables. Et si la pratique montre que, au fur et à mesure de l'aug- 
mentation du nombre d'expériences, la fréquence de l'événement 
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a tendance à se stabiliser, s’approchant rigoureusement d'un nombre 
constant, il est naturel d'admettre que ce nombre est la fréquence 
de l'événement. 

Il est clair que l’on peut vérifier cette hypothèse seulement pour 
des événements dont les probabilités sont susceptibles d'être cal- 
culées directement, c'est-à-dire pour les événements se réduisant 
à un système de cas, car ce n’est qu'alors qu'il existe une méthode 
permettant de calculer la probabilité mathématique. De nombreuses 
expériences réalisées depuis la naissance du calcul des probabilités 
confirment effectivement cette hypothèse. Il est tout naturel 
d'admettre que pour les événements ne se réduisant pas à un système 
de cas, la même loi reste vraie et que le nombre constant vers lequel 
tend la fréquence d’un événement, lorsque le nombre d'expériences 
augmente, n'est rien d'autre que la probabilité de l'événement. 
On peut alors prendre la fréquence d'un événement, calculée pour 
un nombre suffisamment grand d'expériences, pour la valeur appro- 
chée de la prubabilité. C'est ce qu'on fait en pratique, en détermi- 
nant à partir de l'expérience les probabilités des événements ne se 
réduisant pas à un système de cas. 

I] y a lieu de noter que la tendance de la fréquence relative vers 
la probabilité avec augmentation du nombre d'expériences diffère 
quelque peu d’une tendance vers une limite au sens mathématique 
du terme. 

Lorsqu’en mathématiques on dit que la variable X, tend vers 
une limite constante a, lorsque x augmente, ceci signifie que la 
différence | X, — a | devient inférieure à un nombre positif quelconque 
e pour tous les » supérieurs à un certain nombre suffisamment grand. 

Pour ce qui est de la fréquence relative d'un événement et de 
sa probabilité, une telle affirmation catégorique n'est pas possible. 
En effet, il n’est physiquement pas impossible que même pour un 
grand nombre d'expériences la fréquence d’un événement s’écartera 
notablement de sa probabilité; mais un tel écart important est 
assez peu probable, et d'autant moins que le nombre d'expériences 
est grand. Par exemple, lorsque l’on jette une pièce de monnaie dix 
fois, il est physiquement possible (bien que peu probable) d'amener 
toutes les dix fois face et donc d'obtenir la fréquence d'apparition 
de face égale à 1 ; lorsque l’on jette cette pièce 1000 fois, cet événe- 
ment reste encore physiquement possible, mais il est tellement peu 
probable que l’on peut aisément le considérer comme pratiquement 
irréalisable. Ainsi, lorsque le nombre d'expériences augmente, la 
fréquence tend vers la probabilité, bien que non pas avec une certi- 
tude cent pour cent, mais avec une probabilité assez élevée pour que, 
avec un nombre suffisamment grand d'expériences. on puisse la 
considérer comme une certitude. 

En théorie des probabilités la manière dont très souvent les 
grandeurs tendent les unes vers les autres porte un caractère particu- 
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et pour le décrire on utilise la notion de convergence en proba- 
bilité. 

On dit que la grandeur X, terd (ou converge) en probabilité 
vers la grandeur a si pour un & aussi petit que l'on veut la probabilité 
de l'inégalité | À, — a |<< e tend vers l'unité lorsque nr augmente 
indéfiniment. 

En utilisant ce terme, on peut dire que lorsque le nombre d'expé- 
riences augmente, la fréquence d'un événement ne tend pas 
vers sa probabilité, mais converge en probabilité vers ce 
nombre. 

Cette propriété de convergence de la fréquence en probabilité, 
exposée ici sans fondements mathématiques suffisants, sur des bases 
pratiques et le bon sens, est l’objet du théorème de Bernoulli qui 
sera démontré dans le chapitre 13. 

Ainsi, en introduisant la notion de fréquence d'un événement 

et en utilisant la relation existant entre la fréquence et la probabili- 
té, on peut attribuer une certaine probabilité comprise entre zéro 
et l'unité, non seulement aux événements se réduisant à un système 
de cas, mais également à ceux qui ne s'y réduisent pas; dans ce 
dernier cas la probabilité d'un événement peut approximativement 
être déterminée par la fréquence de l'événement pour un grand nom- 
bre d'expériences. 
" Nous verrons ultérieurement que pour trouver la probabilité 
d'un événement ne se réduisant pas à un système de cas, il n'est pas 
toujours indispensable de déterminer la fréquence directement 
à partir de l'expérience. La théorie des probabilités dispose de nom- 
breuses méthodes permettant de trouver indirectement les probabili- 
tés en fonction des probabilités d'autres événements liés à ceux-ci. 
Ce sont ces méthodes indirectes qui sont l’objet de la théorie des 
probabilités. Cependant même ces méthodes indirectes font, en fin 
de compte, appel à l'expérience. La fiabilité et la valeur effective 
des calculs pratiques menés à la base de la théorie des probabilités 
sont déterminées par la qualité et la quantité des données expéri- 
mentales utilisées. 

_ De plus, pour les applications pratiques des méthodes probabilis- 
tes, il faut être sûr que le phénomène aléatoire étudié est réellement 
un effet de masse pour lequel, du moins dans un certain intervalle 
de temps, la fréquence est stable. Ce n'est que dans ce cas qu’on 
peut parler des probabilités des événements en entendant par là 
non pas des fictions mathématiques mais les caractéristiques réelles 
des phénomènes aléatoires. 

Par exemple, l'affirmation ele calcul mené sur ordinateur 
durant 10 heures avec une probabilité de 0,9 ne contient pas d'er- 
reurs » a un sens bien déterminé, car de tels calculs sont des opéra- 
tions courantes se répétant de nombreuses fois dans des conditions 
analogues. 
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Au contraire, l'affirmation «un problème scientifique est 
résolu correctement avec une probabilité de 0,9» n'a aucun sens, 
car la solution d'un problème scientifique est une opération indivi- 
duelle et il serait une erreur d'estimer par les méthodes probabilistes 
la vraisemhlance des fondements scientifiques. 


2.4. Variable aléatoire 


Une des notions fondamentales de la théorie des probabilités est 

celle de variable aléatoire. 

On appelle variable aléatoire une > grandeur qui peut dans l’expé- 
rience prendre l’une quelconque des valeurs possibles, inconnue 
d'avance. 

Exemples de variables aléatoires: 

1) le nombre de coups réussis parmi trois coups tirés; 

2) le nombre d'appels journalier d'un central téléphonique : 

3) la fréquence de face dans une partie de 10 coups. 

Dans les trois exemples mentionnés les variables aléatoires peu- 
vent prendre l’une des valeurs qu'on peut énumérer d'avance. 

Ainsi, dans l'exemple 1) ces valeurs sont: 


0, 1, 2, 3; 
dans l'exemple 2) ce sont: 
1, 2, 3, 4, 
et dans l'exemple 3): 
0:01: 0,2: ..5: 1,0. 


Des variables aléatoires prenant des valeurs discrètes, pouvant 
être énumérées d'avance, sont dites discrètes ou discontinues. 

Il existe également des variables aléatoires d'un autre type, 
par exemple: 

1) l’abscisse d'un point se déplaçant le long de l’axe des abscisses 
d'une façon aléatoire; 

2) l'erreur de pesée d’un corps sur une balance automatique ; 

3) la vitesse d'un avion à une altitude donnée; 

4) le poids d'une graine de blé prise au hasard. 

Les valeurs éventuelles de ces variables aléatoires ne sont pas 
séparées les unes des autres: elles remplissent d'une manière con- 
tinue un certain intervalle qui parfois a des limites très nettes, le 
plus souvent celles-ci sont indéterminées. 

Des variables aléatoires dont les valeurs possibles remplissent 
d'une manière continue un certain intervalle sont dites continues. 

La notion de variable aléatoire joue un rôle très important en 
théorie des probabilités. Si la théorie classique des probabilités 
opérait principalement avec des événements, au contraire la théorie 
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moderne préfère là, où il est possible, d'utiliser des variables aléa- 
toires. 

Nous allons donner quelques exemples typiques pour la théorie 
des probabilités où l'on passe d’un événement à une variable aléa- 
toire. 

Soit une expérience dans laquelle l'événement À peut apparaître 
ou ne pas apparaître. Au lieu de l'événement À on peut envisager 
la variable aléatoire X, égale à 1 si l'événement À a lieu, et à 0 dans 
le cas contraire. Cette variable aléatoire est de toute évidence dis- 

crête, car elle prend deux valeurs pos- 
y sibles : O0 et 1. Elle est appelée variable 
indicatrice de l'événement 4. Dans la 


pratique, il est souvent plus commode 
d'utiliser au lieu des événements les 
variables indicatrices qui leur sont 
associées. Par exemple, si l’on effectue 
une série d'expériences dans chacune 


TZ 
desquelles on peut voir apparaître 
l'événement À, le nombre total d'ap- 
paritions de l'événement est égal à la 


scmme des variables indicatrices de 
l'événement À dans toutes les expé- 
riences. 

D'un autre côté, très souvent, pour 
calculer la probabilité d'un événement 
il est commode d'hssocier à cet événement une variable aléatoire 
continue (ou un système de variables continues). 

Supposons que l’on mesure les coordonnées d'un certain objet OU 
pour construire le point #7 le représentant sur un dessin panoramique 
d'une région. Nous nous intéressons à l'événement À consistant 
en ce que l'erreur À dans la position du point M ne sera pas supé- 
rieure à une certaine valeur rs (fig. 2.4.1). Désignons par À, Y les 
erreurs aléatoires de mesure des coordonnées de l'objet. Il est clair 
que l'événement À équivaut à ce que le point aléatoire #£ de coordon- 
nées X, Y se trouve à l’intérieur d'un cercle de rayon r, de centre 0. 
En d'autres termes, pour que l'événement À ait lieu les variables 


D] 


aléatoires À et YŸ doivent satisfaire à l'inégalité: 
X?+YI<r,.. (2.4.1) 


La probabilité de l'événement À n'est rien d'autre que la proba- 
bilité ‘de vérification de l'inégalité (2.4.1). Cette probabilité peut 
être déterminée si l’on connaît les propriétés des variables aléatoi- 
res À, Y. 

Ce lien étroit entre les événements et les variables aléatoires 
est caractéristique pour la théorie moderne des probabilités, qui 
chaque fois que c'est possible passe d'un système d'événements à un 


Fig. 2.4.1 
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système de variables aléatoires. Cette dernière méthode est bien 
plus souple et plus universelle que la première et convient mieux 
à la résolution des problèmes relatifs aux phénomènes aléatoires. 


2.5. Evénements presque impossibles et événements 
presque certains. Principe de certitude pratique 


Dans le 8 2.2 nous avons introduit les notions d'événement 
impossible et d'événement certain. La probabilité de l'événement 
impossible, égale à zéro, et la probabilité de l'événement certain, 
à l'unité, sont deux limites extrêmes de l'échelle des probabi- 
ités. 

Dans la pratique on a souvent affaire non pas à des événements 
impossibles et certains, mais à des événements « presque impossi- 
bles » et « presque certains ». . 

On appelle événement presque impossible un événement dont la 
probabilité n'est pas exactement égale à zéro, mais en est très voisine. 

Soit, par exemple, l'expérience suivante: 32 lettres d'un alpha- 
bet *), écrites chacune sur une carte isolée, sont mélangées dans une 
urne : on tire une carte au hasard, on inscrit la lettre qu'elle porte 
et on remet la carte dans l’urne que l’on secoue pour bien mélanger 
les cartes. On répète 38 fois cette expérience. Considérons l’événe- 
ment À consistant en ce que, après ces 38 tirages non exhaustifs. 
on verra se composer la première ligne de « Tartuffe » de Molière: 

« Allons, Flipote, allons, que d'eux je me délivre ». 

Du point de vue logique cet événement n'est pas impossible : 


on peut] calculer sa probabilité qui est égale à (5): mais cette 


probabilite est tellement petite que l’on peut considérer l'événe- 
ment À comme presque impossible. 

On appelle événement presque certain un événement dont la pro- 
babilité n'est pas exactement égale à l'unité, mais en est très voisine. 


Si un événement quelconque À dans une expérience est presque 
impossible, l'événement contraire À, équivalent à la non-réalisation 
de À, sera presque certain. Ainsi, du point de vue de la théorie des 
probabilités, on peut indifféremment parler d'événements presque 
impossibles ou d'événements presque certains, car ils accompagnent 
toujours les uns les autres. 

Les événements presque impossibles et presque certains jouent 
un rôle très important dans la théorie des probabilités; toutes les 
applications pratiques sont basées sur ces notions. 

En effet, si l’on sait que la nrobabilité d'un événement dans une 
expérience est égale à 0,3, cela ne permet pas de prévoir le résultat 


*) On suppose qu'il s’agit de l'alphabet français, plus les caractères é, 
è, à, à, ç et l’apostrophe (la virgule). 
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de l'expérience. Mais si la probabilité d'un événement dans une 
expérience est insignifiante ou au contraire très voisine de l'unité, 
on peut prévoir le résultat de l'expérience; dans le premier cas on 
ne peut pas s'attendre à l'apparition de l'événement À; dans le 
second on a toutes les raisons de le voir se produire. Dans ce pronostic 
on se base sur le principe de certitude pratique qui peut être formulé 
comme suit. 

Si la probabilité d'un événement À quelconque dansune expérience 
donnée E est suffisamment petite, on peut être presque certain que 
lorsque l'expérience E est effectuée une seule fois, l'événement À n'auræ 
pas lieu. 

En d'autres termes, si la probabilité de l'événement À dans une 
expérience donnée est très petite, on peut mener cette dernière 
comme si cet événement était impossible, c'est-à-dire sans tenir 
compte de sa possibilité de réalisation. 

Dans l'expérience quotidienne on utilise toujours, bien qu'incons- 
ciemment, le principe de certitude pratique. Par exemple, en partant 
en voyage par chemin de fer on ne tient pas compte de la possibilité 
d'une catastrophe, bien qu'une probabilité infime de cet événement 
existe. 

Le principe de certitude pratique ne peut être démontré par des 
méthodes mathématiques; il se trouve confirmé par toute l'expé- 
rience humaine. | 

La question de savoir à quel point la probabilité d'un événement 
doit être petite pour que celui-ci puisse être considéré comme impossi- 
ble sort du cadre de la théorie mathématique et, dans chaque cas, 
doit être résolue à partir de considérations pratiques conformément 
à l'importance du résultat désiré. 

Par exemple, si la probabilité d'explosion intempestive d'une 
mine est égale à 0,01, on peut encore l'admettre et considérer la 
défectuosité qui en est cause comme un événement pratiquement 
impossible. Au contraire, si la probabilité de non-ouverture d'un 
parachute lors d'un saut est égale à 0,01, on ne peut admettre que 
le défaut est un événement pratiquement impossible et il y a lieu 
d'augmenter la fiabilité du mécanisme du parachute. 

L'un des problèmes essentiels de la théorie des probabilités est 
la recherche des événements pratiquement impossibles (ou pratique- 
ment certains) permettant de prévoir le résultat de l'expérience ainsi 
que la recherche des conditions pour lesquelles tel ou tel événement 
devient presque impossible (ou certain). En théorie des probabilités 
il existe un certain nombre de théorèmes, appelés théorèmes limites, 
établissant l'existence des événements presque impossibles (ou 
certains) lorsque le nombre d'expériences ou le nombre de variables 
aléatoires englobées par le problème augmente. A titre d'exemple 
on peut citer le théorème déjà mentionné de Bernoulli (une forme 
simple de la loi des grands nombres). Rappelons qu'en vertu du 
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théorème de Bernoulli, pour un grand nombre d'expériences, l’événe- 
ment consistant en ce que la différence entre la fréquence d'un événe- 
ment et sa probabilité soit infiniment petite devient presque certain. 

En plus des événements presque impossibles (certains) permettant 
de prévoir avec certitude le résultat de l'expérience malgré le hasard, 
on envisage en théorie des probabilités des variables aléatoires d’un 
type particulier jouant un rôle important. Ces variables, bien qu'aléa- 
toires, ont des variations tellement insignifiantes qu'on peut les 
considérer comme pratiquement non aléatoires, ou presque certaines. 
A titre d'exemple on peut citer la fréquence d’un événement pour 
un grand nombre d'expériences. Bien qu'aléatoire, pour un grand 
nombre d'expériences, ce nombre varie dans des limites étroites 
au voisinage de la probabilité de l'événement. 

Des variables presque certaines permettent de prédire le résultat 
numérique de l'expérience, malgré la présence du hasard, et d'opérer 
avec ce résultet avec certitude, tout comme on le fait avec des données 
fournies par des méthodes des sciences exactes. 


CHAPITRE 3 


THÉORÈMES FONDAMENTAUX 
DE LA THÉORIE DES PROBABILITÉS 


3.1. Rôle des théorèmes fondamentaux. 
Somme et produit d'événements 


Dans le chapitre précédent nous avons étudié les méthodes directes 
de calcul des probabilités, à savoir la formule classique pour la 
probabilité d’un événement appartenant à un système complet 
d'événements (il s'agit du système de « cas » ou du schéma du tirage 
exhaustif) et la méthode de calcul approché de la probabilité d’après 
la fréquence relative d’un événement ne se réduisant pas à un système 
de cas. Cependant, ces méthodes directes ne jouent qu’un rôle médio- 
cre dans la théorie des probabilités, car elles ne sont pas toujours 
commodes et sont parfois inutilisables. Même lorsque l'événement 
est tel que le schéma du tirage exhaustif est applicable, le calcul 
direct de la probabilité par la formule (2.2.1) s'avère parfois trop 
compliqué. Pour ce qui est des événements auxquels ce schéma n'est 
pas applicable. leurs probabilités sont très rarement calculées directe- 
ment à l’aide des fréquences. Dans les applications pratiques il faut 
souvent déterminer les probabilités des événements qu'il est difficile 
de reproduire expérimentalement. Par exemple, s'il v a lieu de déter- 
miner la probabilité d'abattre un avion dans un combat aérien, il 
est évident que le calcul de cette probabilité d'après la fréquence 
de réalisation est pratiquement impossible ; ceci non seulement parce 
que les expériences se seraient avérées trop compliquées et coûteuses, 
mais également parce qu'on entreprend les calculs de la probabilité 
précisément pour prédire le résultat de l'expérience pour des dispo- 
sitifs téchniques au stade du projet, pour choisir les paramètres 
constructifs les plus rationnels d'un dispositif projeté. 

C'est pourquoi la plupart du temps on utilise des méthodes dites 
indirectes, permettant de trouver d'après les probabilités connues 
des événements déjà étudiés les probabilités d’autres événements, 
liés aux premiers. Toute la théorie des probabilités se réduit grossiè- 
rement à un système de méthodes indirectes permettant de réduire 
l'expérience au minimum. 

En appliquant ces méthodes indirectes on utilise sous une forme 
ou une autre les théorèmes fondamentaux de la théorie des probabili- 
tés. I1 s’agit du théorème d'addition des probabilités et du théorème 
de multiplication des probabilités. En toute rigueur, ces deux théorè- 
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mes peuvent être démontrés seulement pour le cas du tirage exhaus- 
tif; pour tous les autres cas ils doivent être adoptés comme des 
assertions ou des postulats. 

Avant de formuler et de démontrer les théorèmes fondamentaux, 
nous introduisons des notions auxiliaires de somme et de produit 
d'événements. 

Dans de nombreux domaines des sciences exactes on utilise des 
opérations symboliques qui reçoivent leur appellation par analogie 
avec les opérations arithmétiques similaires, dont elles possèdent 
un certain nombre de propriétés. Telles sont, par exemple, les opéra- 
tions d’addition et de multiplication des vecteurs en mécanique, 
les opérations d'addition et de multiplication des matrices en algè- 
bre, etc. Ces opérations, soumises à certaines lois, permettent non 
seulement de simplifier l'écriture, mais dans de nombreux cas 
d’alléger la structure logique des déductions scientifiques. L'intro- 
duction des opérations symboliques sur les événements est également 
de grande utilité en théorie des probabilités. 

On appelle somme de deux événements À et B et on note À + B 
l'événement C consistant en ce que soit réalisé ou bien l’événement 
A, ou bien l'événement B, ou les deux ensemble. 

Par exemple, si l'événement À est l'atteinte d’une cible lors du 
premier coup, l'événement B l'atteinte de la cible lors dusecond coup, 
alors l'événement C — À + B traduit le fait que la cible est atteinte, 
füt-ce avec le premier, le second ou les deux coups à la fois. 

Si les événements À et B sont incompatibles, ils ne peuvent de 
toute évidence se produire simultanément et la somme À + B expri- 
me la réalisation soit de l'événement À, soit de l'événement LB. 
Si par exemple À est « tirage d'un cœur », et B « tirage d’un carreau», 
l'événement C = À + B est « tirage d'une carte de couleur rouge, 
cœur ou carreau ». 

Résumons: on appelle somme de deux événements À et B l'événe- 
ment C correspondant à la réalisation de l’un des événements À ou B. 

La somme de plusieurs événements est l'événement correspondant 
à la réalisation au moins d'un des événements en question. 

Par exemple l'expérience consiste à tirer cinq coups sur une 
cible. Enumérons les événements qui peuvent se produire: 


Ao— aucun coup n'atteint le but; 

À; — exactement un coup atteint le but: 

A2 — exactement deux coups atteignent le but; 
À 3 — exactement trois coups atteignent le but : 
A; — exactement quatre coups atteignent le but; 
À; — tous les cinq coups atteignent le but. 


L'événement 


À = Ào + Ai + 42 
3— 2824 
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se lit « deux coups au plus atteignent le but » et l'événement 
B — A3 + À4 + À; 


se lit « trois coups au moins atteignent le but ». 

On appelle produit de deux événements À et B et on note AB 
l'événement C consistant en la réalisation simultanée des événe- 
ments À et B. 

Par exemple, si l'événement À est « tirage d’un as » dans un jeu 
de cartes, l'événement B est « tirage d'un carreau », l'événement 
C = AB correspond au «tirage d'un as de carreau ». 

On appelle produit de plusieurs événements l'événement corres- 
pondant à la réalisation simultanée de tous ces événements. 

Par exemple, si l’on tire trois coups sur une cible et que l'on 
considère les événements suivants: 


B; — le premier coup est raté; 
B> — le second coup est raté; 
B3 — le troisième coup est, raté, 
l'événement 
B — B;B2B; 


correspond à ce qu'aucun coup n'a atteint le but. 

Pour faciliter le calcul des probabilités il est d'usage de repré- 
senter des événements compliqués sous la forme de combinaisons 
d'événements plus simples en utilisant les opérations d'’addition 
et de multiplication. 

Par exemple, si trois coups sont tirés sur une cible et que l’on 
considère les événements élémentaires suivants: 


A; — le premier coup atteint le but; 
A; — le premier coup est raté; 

A2 — le second coup atteint le but; 
A2 — le second coup est raté; 

A3 — le troisième coup atteint le but; 
A3 — le troisième coup est raté, 


alors l'événement composé B correspondant à ce qu'exactement un 
coup atteint le but des trois coups tirés peut être présenté comme 
la combinaison des événements élémentaires : 


B = A1424 5 + A14243 + Ai424s 


L'événement C selon lequel deux coups au moins atteindront Îla 
cible peut s'écrire comme suit: 


C = A1424 3 + A1424 3 + A1424 5 + A1424 > 


En théorie des probabilités on représente souvent ainsi les événe- 
ments composés. 
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Par définition de la somme et du produit des événements on a 
À + À = À; 
AA = À. 
Si l'événement B est un cas particulier de l'événement À on a: 
A + B = À; 
AB = B. 


Les notions de somme et de produit des événements peuvent être 
illustrées par des images explicatives comme celles des figures 3.1.1 
et 3.1.2. Désignons par À l'événement «le point tombe dans le 


Fig. 3.1.1 Fig. 3.1.2 


domaine À », et par B l'événement « le point tombe dans le domai- 
ne B », alors l'événement À + B est que le point tombe dans le 
domaine hachuré sur la figure 3.1.1,a et l'événement AB est qu'il 
tombe dans le domaine hachuré sur la figure 3.1.1,b. 

D'une manière analogue on a montré sur la figure 3.1.2 la somme 
et le produit de trois événements. 


3.2. Théorème des probabilités totales 


Ce théorème pose: 
La probabilité de réaliser l'événement somme de deux événements 
incompatibles est égale à la somme des probabilités de ces événements: 


P(A—+ B) = P(4)+ P (B). (3.2.1) 


Nous allons démontrer ce théorème pour le schéma du tirage 
exhaustif (système de « cas »). Supposons que les résultats éventuels 
d’une expérience sont nr «cas», que nous figurons par »r points: 

mA k=<B 


3% 
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Supposons que parmi ces z cas m= soient favorables à l'événement 4, 
et À à l'événement B. On a alors 


P(4)=%; P(B=-<. 


Les événements À et B étant incompatibles, aucun cas n'est 
favorable à la réalisation simultanée de À et B. Par conséquent, 
m + k cas sont favorables à l’événement À + B de sorte que 


P(A+B)= "TE. 


En substituant les expressions obtenues dans la formule (3.2.t) 
on obtient une identité. Le théorème se trouve ainsi démontré. 

Généralisons ce théorème au cas de trois événements. Désignant 
par D l'événement À + B et ajoutant à la somme encore un événe- 
ment C, on montre facilement que 


P(A+B+C)=P(D+C)=P(D)+ P(C) = 
= P(A+B)+ P(C)=P(4)+ P(B)+ P (C). 
Naturellement, ceci peut se généraliser par récurrence à un 


nombre quelconque d'événements incompatibles. En effet, suppo- 
sons que ce théorème soit vrai pour r événements 


A:, À 2, 7) An; 


montrons qu'il sera également vrai pour n + 1 événements 
A;, À 2; 4 An A n+1° 
Notons: 
A+ A:+ ssh ds C0, 
Avec ces notations on a: 
P (A+ Aokt...+ An + Anti) = P (C+ Au+:) = 
= P(C)+ P (An+1). 


Mais comme pour n événements le théorème est supposé démontré, 
on a: 


P(C)=P(4; + P(42) +...+ P (4,), 
d'où 
P(Ai“- A2... ++ Ant An) = 
= P (4:) + P (42) io ... + P (4) + P(A,;:), 


ce qu'il fallait démontrer. 
Ainsi le théorème des probabilités totales est applicable à un 
nombre quelconque d'événements incompatibles. Il est d'usage de 
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l'écrire comme suit: 
P (2 Ai) = 2 P (Ai). (3.2.2) 


Nous allons voir les corollaires qui en découlent. 

Corollaire 1. Si les événements A1, A2, ..., A, forment 
un système complet d'événements incompatibles, la somme de leurs 
probabilités est égale à l'unité: 


D P(AD=1. 


Démonstration. Les événements A:,, 42, ..., A4, for- 
mant un système complet, la réalisation de l’un au moins d'entre 
eux est un événement certain: 


P (4i+ A2+...+ An) = 1. 


Les événements 41, A2, . .., Ah étant incompatibles, on peut leur 
appliquer le théorème des probabilités totales: 


P(Ai-+ A42+...+ 4n)= P(4,)+ P (42) +... + 
+P(4)= 2 P(4i), 
d'où 
» P(A:)=1, 
i=1 


ce qu'il fallait démontrer. 

Avant de démontrer le second corollaire du théorème des proba- 
bilités totales nous allons définir la notion d'événement contraire. 

On appelle événements contraires deux événements incompatibles 
formant un système complet. 

L'événement contraire de À est généralement désigné par À. 

Exemples d'événements contraires : 

1) À — atteindre le but lors d’un coup; 

A — rater le coup; 
2) B — obtenir face en jetant une pièce de monnaie; 


B — obtenir pile: 
3) C — fonctionnement sans défaillance de tous les éléments 
d'un appareil ; 
C — défaut au moins d’un élément ; 
4) D — trouver au moins deux pièces défectueuses dans un lot 
de contrôle: 


D — trouver au plus une pièce défectueuse. 
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Corollaire 2. La somme des probabilités des événements 
contraires est égale à l'unité: 


P (4) + P (4) = 1. 


Ce corollaire est un cas particulier du corollaire 1. On l'a mis 
à part en raison de son importance pratique. Souvent dans la prati- 
que il est plus facile de calculer la probabilité de l'événement con- 
traire À que celle de l'événement 4. Dans ces cas on calcule P (4) 
et on trouve P (4) = 1 — P (4). 

Voyons quelques exemples d'application du théorème des pro- 
babilités totales et de ses corollaires. 


Exemple 1. Soient 1000 billets de loterie; un des billets gagne 500 rou- 
bles, 10 billets 100 roubles chacun. 50 billets gagnent 20 roubles chacun, 100 bil- 
lets 5 roubles chacun, tous les autres ne gagnant rien. Trouver la probabilité 

pour le propriétaire d'un seul billet de gagner au 
moins 20 roubles. 
Solution. Considérons les événements sui- 


vants: 
À — gagner aù moins 20 roubles: 
A; — gagner 20 roubles;: 
nm A2 — gagner 100 roubles: 
As — gagner 500 roubles. 
On a de toute évidence: 


A = À + A2 + A3. 
En vertu du théorème des probabilités totales: 
P(4)= P (4:) + P (42) + P (45) = 
Fig. 3.2.1 = 0,050 + 0,010 + 0,001 = 0,061. 


Exemple 2. Une cible ronde (fig. 3.2.1) a trois zones 7, II et III. 
La Re d'atteindre la première zone avec un coup est 0,15; la seconde 
0,23; la troisième 0,17. Trouver la probabilité de rater le coup. 

Solution. Désignons par À un coup raté et par À un coup atteignant 
le but. On a alors: 


À = Ai + A2 + Au 


où 41. A2. À; sont les événements « attoindre la première, la seconde et la troi- 
sième zones, et 


. (4) = P (41) + P (42) + P (43) = 0,15 + 0.23 + 0,17 = 0,55. 
ou 
P(4)=1— P (4) = 0.45. 


Exemple 3. Au bout d'un certain temps de fonctionnement un appa- 
reil peut se trouver dans l’un des états suivants: 

1 — bon état de fonctionnement : 

2 — légèrement déréglé; 

3 — certaines pièces doivent être remplacées; 

4 — une révision générale s'impose. 

Les probabilités respectives de ces quatre états sont 0,55; 0.1 ; 0,15 et 0.2. 
Dans le premier cas l’appareil peut continuer à fonctionner, dans le second 
cas il faut 10 minutes de réglages, dans le troisième les réparations prennent 
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deux heures, dans le quatrième 24 heures. Trouver la probabilité pour qu'au 
bout de trois heures après la fin du service précédent l'appareil soit en mesure 
de fonctionner. 

Solution. Considérons les événements: 

A — l'appareil est prêt à fonctionner après 3 heures; 

A; — l'appareil peut fonctionner immédiatement ; 

A2 — nécessité d’un réglage: 

A3 — nécessité de remplacer certaines pièces. 

On a de toute évidence: 

= A1 + A2 + 43. 
En vertu du théorème des probabilités totales on a: 
P (A) = P (4:) + P (42) + P (43) = 0,55 + 0,1 + 0,15 = 0.8. 


Pour résoudre ce problème il serait plus facile de passer à l'événement 
contraire A—el’appareil ne sera pas prêt à fonctionner dans 3 heures ». 
L'événement À est équivalent à la nécessité d’une grosse réparation; d'où: 
P (4) = 0,2. 
P(A)=1— P (A) = 0,8. 
Comme nous l'avons déjà noté, le théorème des probabilités 
totales (3.2.1) n'est vrai que pour des événements incompatibles. 


Lorsque les événements À et B ne s’excluent pas mutuellement, la 
probabilité de l'événement somme est donnée par la formule: 


P(A+ B) = P(4)+ P (B) — P (AB). (3.2.3) 


La figure 3.2.2 donne une démonstration figurative de la for- 
mule 3.2.3. 

D'une manière analogue, la probabilité de l'événement somme 
d:: trois événements simultanés est donnée par la formule: 


P(4A+B+C)=P(4)+ P(B)+ P (C) — P (4B) — 
— P (AC) — P (BC) + P (ABC). 
La figure 3.2.3 permet de s'en convaincre. 


On démontre aisément par récurrence la formule générale de 1]: 
probabilité de la somme d'un nombre quelconque d'événements 
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simultanés : 


P @ù Ai) = 2 P (A;i) — 2 (4:4;) + 


+ 24 P(AiAjAn) —...+(—1)""1P (4342 ... An), (3.2.4) 
4e Je 
où les sommes sont étendues à différents indices i; à, j; à, j, k, etc. 
La formule (3.2.4) exprime la probabilité de la somme d'un 
nombre quelconque d'événements en fonction des probabilités des 
produits de ces événements pris un à un, deux à deux, etc. 
On peut écrire une formule analogue pour le produit des événe- 
ments. En effet, la figure 3.2.2 montre que 


P (AB) = P (4) + P (B) — P (A +B). (3.2.5) 
De même la figure 3.2.3 donne: 


P (ABC) = P (4) +P(B)+P(C) — P (4 + B) — 
— P(A+C)—P(B+C)+P(A+B+C). (3.2.6) 


La formule générale exprimant la probabilité du produit d’un 
nombre quelconque d'événements en fonction des probabilités des 
sommes de ces événements pris un à un, deux à deux, etc., s'écrit: 


P (Aid: Ar)= > P(A;)— 2 P(Ai+A;)+ 


1 


+ 2, P(Ai+ Aj+ An) + ….+(—1)"1P(A4+...+4). (3.2.7) 


ä, }, 


+ Les formules du type (3.2.4) et (3.2.7) sont couramment utilisées 
pour les transformations des différentes expressions contenant les 
probabilités des sommes et des produits d'événements. Dans certains 
problèmes il est plus commode d'utiliser seulement des sommes et 
dans d’autres seulement des produits; des formules de transforma- 
tion permettent de passer des unes aux autres. 


Excmple. Un appareil se compose de trois dispositifs. de deux dispo- 
sitifs du premier type: 4, et 42, et d'un dispositif du second type B. Les dispo- 
sitifs À, et 4: sont interchangeables. lorsque l'un est en défaut le second se 
met automatiquement en fonctionnement. Le dispositif B fonctionne indépen- 
damment. Pour que l’apparcil cesse de fonctionner il faut que les deux disposi- 
tifs 4, et 42 ou le dispositif B soient défectucux. Ainsi le défaut de l'appareil, 
l'événement C, peut s’écrire comme suit : 


C = A;AÂ2 + B, 


où A, est le défaut du dispositif 4,; 42 lc défaut du dispositif 4; B le défaut 
du dispositif B. 

Exprimer la probabilité de l’événement C en fonction des probabilités des 
événements qui soient des sommes et non des produits des événements élémen- 
taires A1, À» et BE. 
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Solution. Utilisons la formule (3.2.3): 
P (C) = P (4:42) + P (B) — P (4,4:B), (3.2.8) 
puis la formule (3.2.5): 
P (Ai42) = P (41) + P (A2) — P (41 + A2) 
et enfin la formule (3.2.6): 
P (4:42B) = P (41) + P (42) + P (B) — P (A: + 42) — 
— P (4: + B) — P (42 + B) + P (Ai + 42 + B). 
En substituant ces expressions dans (3.2.8) et en simplifiant on obtient : 
P(C) = P (41 + B) + P (42 + B) — P(A: + 42 + B). 


3.3. Théorème des probabilités composées 


Avant d'exposer ce théorème introduisons la notion importante 
d'événements indépendants et dépendants. 

L'événement À .est dit indépendant de l'événement B si la probabi- 
lité de À ne dépend pas de ce que B se produit ou non. 

L'événement À est dépendant de l'événement B si la probabilité 
de À change suivant que B s'est produit ou non. 

Soient quelques exemples. 

1) Une expérience consiste à jeter deux pièces de monnaie; 
considérons les événements: 


A — obtenir pile sur la première pièce: 
B — obtenir pile sur la seconde pièce. 


Dans ce cas la probabilité de À ne dépend pas de la réalisation 
de B, donc l'événement À est indépendant de l'événement Z. 

2) Une urne contient deux boules blanches et une noire; deux 
personnes tirent chacune une boule de l’urne; considérons les événe- 
ments: 


A — la première personne a tiré une boule blanche; 
B — la seconde personne a tiré une boule blanche. 


La probabilité de l'événement À en l'absence de l'information sur 
l'événement B est égale à 2/3. Si l’on sait que l'événement B s'est 
réalisé la probabilité de À devient égale à 1/2, d'où on conclut que À 
dépend de LB. 

On appelle probabilité conditionnelle de A relative à B et on note 
P (A | B) la probabilité de l'événement À calculée sous la condition 
que l’événement B s'est réalisé. Pour les conditions du dernier 
exemple on a: 


P(4)=£; P(A|B)=+. 


On peut indiquer que À est indépendant de B en écrivant: 
P (418) = P (4), 
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Ja condition de dépendance s'exprime: 
P (4|B)  P (4). 


Nous pouvons maintenant formuler et démontrer le théorème 
des probabilités composées. 

La probabilité du produit de deux événements est égale au produit 
de la probabilité de l'un d'eux par la probabilité conditionnelle de 
l'autre, calculée sous la condition que le premier ait lieu: 


. P (AB) = P (4) P (B| A). (3.3.1) 


Nous allons démontrer ce théorème pour des événements formant 
un système complet (système de « cas »). Supposons que les résultats 
éventuels de l'expérience sont n « cas», que nous figurons comme 
auparavant par nr points: 


Supposons que m cas soient favorables à l'événement À et x cas 
à l'événement B. Comme nous n'avons pas supposé les événements À 
et B incompatibles nous devons admettre qu'il existe en général 
des cas favorables à l'événement À et à l'événement B simultané- 
ment. Soit / le nombre de tels cas. On a alors: 


P(AB)=—<;  P(4)-%. 


Calculons P (B |A), c'est-à-dire la probabilité conditionnelle de 
l'événement B en supposant que À soit réalisé. Si l’on sait que l'évé- 
nement À a eu lieu, seuls m cas, notamment les cas favorables à l’évé- 
nement À, sont à considérer au lieu des » dont on disposait au début 
de l'expérience, ! de ces m cas élant favorables à l’événement B. 
Par conséquent: 


P(B|A)=—. 


En substituant les expressions de P (4B), P (4) et P (B]| 4) 
dans la formule (3.3.1) on obtient une identite, ce qui démontre le 
théorème. 

I] est clair que le théorème des probabilités composées est indiffé- 
rent à l'ordre des événements À et B, ce qui permet d'écrire ce 
thcorème comme suit: 


«P (4B) = P (B) P (4 | B). 
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Mentionnons les corollaires du théorème des probabilités com- 
posées. 

Corollaire 1. Si À est indépendant de B, alors B ne dépend 
pas de À. 

Démonstration. On sait que l'événement À ne dépend 
pas de PB, c’est-à-dire que 


P (4) = P (4 | B). (3.3.2) 
Il y a lieu de démontrer que B ne dépend pas de À, c'est-à-dire que 
P(B)=P(B|4). 


Pour la démonstration nous supposons que P (4) = 0. 
Ecrivons le théorème des probabilités composées sous ses deux 


formes : 
P (AB) = P (A) P (B| 4): 
P (AB) = P (B)P (4 |B), 
d'où 
P(4)P(B|A)=P(B)P(41B) 
ou en vertu de la condition (3.3.2) 
P(4A)P(BIi4)=P(B) P (4). (3.3.3) 


Divisons les deux membres de (3.3.3) par P (4). On a: 
P(B|A) = P (B), 


ce qu'il fallait démontrer. 

En vertu du corollaire 4 la dépendance ou l'indépendance des 
événements sont toujours réciproques. Ceci permet de donner une 
nouvelle définition des événements indépendants. 

Deux événements sont dits indépendants si la réalisation de l'un 
d'eux ne change pas la probabilité de réalisation de l'autre. 

La notion d'indépendance des événements peut être étendue 
à un nombre quelconque d'événements. Plusieurs événements sont 
dits mutuellement indépendants si aucun d'eux ne dépend de toute 
combinaison des autres. 

Corollaire 2. La probabilité du produit de deux événements 
indépendants est égale au produit des probabilités de ces événements. 

e corollaire découle immédiatement de la définition des événe- 
ments indépendants. 

Le théorème des probabilités composées peut être généralisé 
à un nombre quelconque d'événements. Sous sa forme générale, 
il peut se formuler comme suit: 
= La probabilité du produit de plusieurs événements est égale au 
produit des probabilités-de ces événements, la probabilité de chaque 
i-ème événement étant calculée sous la condition que tous les i — 1 


44 THÉORÈMES FONDAMENTAUX DE LA THÉORIE DES PROBABILITÉS [CH. 3 


événements se soient produits: 
P (4142 …. Ah) —_ P (A) P (42141) P (4s | 4:42) . 
...P(An| 4142... An). (3.3.4) 


Cette formule peut être démontrée par récurrence. 
Pour les événements indépendants le théorème se simplifie et 
s'écrit comme suit: 


P (4 14 2 CC A) = P (41) P (4 2) .. P (A), (3.3.5) 


c'est-à-dire que la probabilité du produit des événements indépendants 
est égale au produit des probabilités de ces événements. 

En utilisant le signe du produit on peut écrire ce théorème comme 
suit : 


P quil Ai) = Il P (Ai). (3.3.6) 


Voyons quelques exemples d'application du théorème des pro- 
babilités composées. 


Exemple 1. Une urne contient 2. boules blanches et 3 noires. On tire 
deux boules de l’urne. Trouver la probabilité pour que les deux boules tirées 
soient blanches. 

Solution. Nous allons désigner par À l'apparition de deux boules 
blanches. L'événement À est le produit de deux événements élémentaires : 
A; — «la première boule tirée est blanche »; 4: — «la seconde boule tirée 
est blanche » : 

À = ÀA;42. 


En vertu du théorème des probabilités composées on a: 


P(4)= P (45) P (42 | 41) == 0.1. 


Exemple 2. Même problème que précédemment, mais avec la remise 
de la boule après le premier tirage. 

Solution. Dans ce cas les événements 4, et 4: sont indépendants 
et on a: 


P(4)=P (41) P(A4) ==: —=0,16. 


Exemple 3. Un appareil se compose de trois dispositifs. Durant le 
temps t de fonctionnement de l'appareil les défauts des trois dispositifs peuvent 
survenir de facon indépendante. Un seul défaut suffit pour mettre l'appareil 
hors service. Pour ce temps t la fiabilité (probabilité de fonctionnement sans 
défaillance) du premier dispositif est égale à p, — 0,8; du second à p2 — 0,9: 
du troisième à p3 — 0,7. Trouver la fiabilité de l'appareil. 

Solution. Notons: 

A — fonctionnement sans défaillance de l’appareil ; 

A1 — fonctionnement sans défaillance du premier dispositif; 

A2 — fonctionnement sans défaillance du second dispositif ; 

À 3 — fonctionnement sans défaillance du troisième dispositif; 
avec ces notations on a: 

À = ÀA;A2A3, 
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d'où en vertu du théorème des probabilités composées pour des événements 
indépendants: 


P (A) = P (4:) P (A2) P (A3) = pip2ps = 0,504. 


Très rarement dans les applications pratiques on peut se borner 
à l’utilisation exclusive de l’un ou l'autre des théorèmes examinés. 
Généralement, ces deux théorèmes sont utilisés ensemble, l’événe- 
ment dont il y a lieu de trouver la probabilité étant représenté comme 
une somme de plusieurs événements incompatibles (variantes de 
l'événement étudié), tandis que chacun d'eux est à son tour un 
produit d'événements. 


Exemple 4. Trois coups sont tirés sur une même cible. Les probabilités 
d'atteindre la cible lors du premier. du second et du troisième coup sont respec- 
tivement : 


Ps = 0.4; pa = 0.5; Pa = 0.7. 
| ES la probabilité pour que de ces trois coups exactement l'un atteigne 
a cible. 


Solution. Considérons l'événement À — «exactement un coup atteint 
la cible ». Cet événement peut se produire de plusieurs manières différentes. 
c'est-à-dire qu'il se décompose en plusieurs variantes incompatibles. 

Désignant 41. A2. À. les événements « atteindre la cible » lors du premier, 
du second et du troisième coup respectivement et 


Ai, A2, A,les événements « rater le but » lors du premier, le second et le 
troisième coup. on peut représenter ces variantes comme suit : 


AiÂ2A 3; A14243; 414243, et À = AiA243 + A1424 5 + A14243. 


En utilisant les théorèmes des probabilités totales et composées et compte 
tenu de la propriété des événements contraires on trouve: 


P (A) = P (41424 3) +; P (41424 3) + P (41424 3) = 
= 0,4-0,5-0,3 + 0,6-0,5-0,3 + 0,6-0,5-0,7 = 0,36. 


Exemple 5. Dans les conditions de l'exemple précédent trouver la 
probabilité pour qu'au moins un coup atteigne la cible. 

Solution. Soit l'événement B — « au moins un coup atteint la cible ». 
En utilisant les notations et la méthode de l'exemple précédent on peut écrire 
‘événement B comme une somme de variantes incompatibles, soit: 


B = Ai424 3 + A424 3 + 414243 + A14243 + 414243 + 
+ 414243 + 414243, 
et à l’aide du théorème des probabilités composées trouver la probabilité de 
chacune des variantes et les additionner. Mais cette voie est trop longue; il 
est bon ici de passer de l'événement B à son contraire B: « aucun coup n'a 
atteint la cible ». On a de toute évidence: 
B — A:424 3. 
En vertu du théorème des probabilités composées 

P (B) = P (414243) = 0,6-0,5-0,3 = 0,09, 

d'où L 
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Le dernier exemple est une illustration de l'utilité des événe- 
ments contraires en théorie des probabilités. On peut se guider du 


principe suivant : si l'événement contraire À se décompose en un nombre 
moindre de variantes que l'événement À, il y a lieu pour calculer les 
rrobabilités de passer à l'événement contraire. 


Exemple 6. U'ne urne contient 10 boules blanches et 5 noires: on tire 
4 boules de l’urne. Trouver la probabilité pour que l’une des boules tirées soit 
noire. 

Solution. L'événement 4: «tirer au moins une boule noires a un 
grand nombre de variantes (parmi les boules tirées il EU y avoir des combinai- 
sons différentes de boules noires et blanches). Il est bien plus simple de passer 


à l'événement contraire À: « parmi les boules tirées aucune n'est noire ». 
L'événement À est le produit de quatre événements: 


A — B;,B:B:B;, 
dont les significations sont les suivantes: 


B;, — la première boule est blanche; 
B: — la seconde boule est blanche; 

B:3 — la troisième boule est blanche: 
By — la quatrième boule est blanche. 


En vertu du théorème des probabilités composées on a: 
P(4)= P (81) P (B:|B1)-P (B3] B1B2) X 
10 9 8 7 2 


X PUB BiBeBs)= 251715 15 15? 
d'où 
P(A4)=1—P (4 BL 
si ) = ) = 13 : 

Exemple 7. Un appareil se compose de trois éléments. La fiabilité 
(probabilité de fonctionnement sans défuillance durant un intervalle de temps 
donné) du premier élément est égale à 0,9; du second à 0,8; du troisième à 0,7. 
Le premier élément est indispensable au fonctionnement de l'appareil; si le 
second ou le troisième élément est en défaut, l'appareil fonctionne mais avec un 
rendement inférieur ; la défaillance simultanée du second et du troisième élément 
fait que l'appareil ne peut fonctionner. Les éléments deviennent défectueux 
indépendamment les uns des autres. Trouver la probabilité pour que A Le 
fonctionne durant un intervalle de temps donné (même avec un rendement 
inférieur). 

Solution. Désignons par 


A1 — le fonctionnement sans défaillance du premier élément ; 
A2 -- le fonctionnement sans défaillance du second élément ; 
A3 — le fonctionnement sans défaillance du troisième élément. 


Les événements 4,, A2, À , sont respectivement les défaillances du premier, 
du second et du troisième élément. L'événement A (l'appareil reste en service, 
même avec un rendement inférieur) peut s’écrire comme suit: 


À = A1A243 + A1424 5 + A1424:. (3.3.7) 
L'événement contraire A (l'appareil ne fonctionne pas) s'écrit: 
À = À142A3 + A14243 + 414245 + A14243 + À 4 24 3° 
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Ici l'événement contraire À a plus de variantes que l’événement 4, donc 
il n'y a aucun avantage de l'utiliser. En développant la formule (3.3.7) en 
conformité des théorèmes des probabilités totales et composées on a: 


P (A) = P (A14243) + P (A:1A424 3) + P (A:42Â 5) = 


= P (41) P (42) P (43) + P (41) P (42) P (43) + P (41) P (42) P (As) = 
= 0,9-0,8-0,7 + 0,9-0,2-0,7 + 0,9-0,8-0,3 = 0,846. 


Exemple 8. Un train se compose de 10 wagons; chacun des wagons 
peut avec une probabilité 0,1 (indépendamment des autres) avoir un défaut. 
Avant le départ les wagons sont examinés indépendamment les uns des autres 
pe deux contrôleurs, chacun décelant le défaut (s’il y a eu un) avec une proba- 

ilité égale à 0,7. Un seul défaut décelé suffit pour que le train so iretardé. 
Trouver les probabilités des événements suivants: 


A — le train sera retardé: 
B — le train partira avec au moins un wagon défectueux. 


Solution. L'événement 4 ayant un grand nombre de variantes, et il 
est plus commede de passer à l'événement contraire À : le train ne sera pas retar- 
dé (aucun défaut n’est décelé). 


L'événement À est le produit de 10 événements que nous désignons par C 
consistant en ce qu’un wagon donné n’aura pas de défaut décelé. L'événement C 
se réalise par deux manières : 

C= Ci + Ca 
où 
C; — un wagon quelconque est sans défaut; 
C2 — le wagon a un défaut non décelé, ni par le premier, ni par le second 


contrôleur. 

On a: 
P(C) = P (C;) + P (C2), 
P (Ci) = 0,9, 


P (C2) = 0,1-0,3-0,3 = 0,009, 
P (C) = 0,909 et 
P (A) = 0,909 & 0,385; P (4) = 1 — P (4) = 0,615. 
Pour calculer la probabilité de l'événement B il y a lieu de noter que l'évé- 
nement À se décompose en deux variantes: 
A=D+B, 


où D — le train n'a pas de wagon défectueux. 
D où: 


P (B)= P(4)— P (D). 
L'événement D est le produit de 10 événements consistant en ce qu’un wagon 
quelconque n'a pas de défaut, alors: 
P (D) = 0,99 Z 0,349, 
P (B) = 0,385 — 0,349 = 0,036. 


Exemple 9. On jette une pièce de monnaie 6 fois. Trouver la proba- 
bilité pour que face sorte plus fréquemment que vile. | 

Solution. Pour trouver la probabilité de l'événement qui nous inté- 
resse (nombre de faces supérieur à celui de piles) on pourrait énumérer toutes 
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ses variantes possibles, par exemple: 


A; — six faces et aucun pile, 


A2 — cinq faces et un pile, 
etc. 


Mais il est plus simple d'utiliser une autre méthode. Enumérons toutes 
les issues éventuelles de l'expérience: 


À — face sort plus fréquemment que pile; 


B — pile sort plus fréquemment que face; 
C — pile et face sortent en nombre égal. 


Les événements À, B, C sont incompatibles et forment un système complet 
d'événements. Par conséquent : 


P(A)+P(B)+P(C)=1. 
Le problème étant symétrique par rapport à pile et face. on a: 


P (4)= P (B), 
d'où 
2P (A)+ P(C)=1 
7 1—P(C 
P (4) = 


Cherchons la probabilité de l'événement C de réaliser en six jets exactement 
trois fois face (et donc trois fois pile). La probabilité de chacune des variantes 
de l'événement C (par exemple, de la suite face, pile, face, face, pile, pile) est 
la même et égale à (1/2). Le nombre de ces combinaisons étant égal à C3 = 2 


Fr, 20 
(nombre de manières permettant de choisir des six jets les trois où face ap- 
paraît), on a: 


d'où 


1 5 11 
P(A)=S (: 6) | 
Exemple 10. Un appareil se compose de quatre éléments: 4:, 42, 
À 5 A4, l'élément 42 doublant 4,, et À, doublant 4. Lorsque l'un des élé- 
ments principaux (4; ou À) est en panne, on passe automatiquement à l'élé- 
ment auxiliaire. La fiabilité (probabilité de fonctionnement sans défaillance) 
de chacun des éléments pour un certain laps de temps est respectivement p:1, 
P2, P3, D«- La fiabilité des dispositifs de commutation est égale à p. Les défauts 
des éléments surviennent indépendamment. Trouver la fiabilité de l’appareil. 
Solution. Considérons deux ensembles généralisés B et C englobant 
l'un les éléments 4,, 4: et le dispositif de commutation. et l’autre les éléments 
A3, A, et le dispositif de commutation correspondant. Soient les événements : 


A — fonctionnement sans défaillance de l'appareil. 
B — fonctionnement sans défaillance de l’ensemble B, 


C — fonctionnement sans défaillance de l’ensemble C. 
Il est clair que 


= BC, 
d'où 
P (A) = P (B)-P (C). 
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Trouvons la probabilité de l'événement B. Celui-ci se décompose en deux 
variantes: 
A1 — l'élément A: fonctionne sans défaillance, 
A; — l'élément 4, se trouve défectueux mais le dispositif de commutation 
à et l'élément 42 fonctionnent normalement. 
n a: 


P(B)=P(41)+P(43)= pa+ (1 — p1) PP2, 
d'une manière analogue: 


P (C) = ps + (1 — ps) pra. 
d’où: 
P (A) = {ps + (1 — ps) pp2] [Ps + (À — ps) pri]. 


3.4. Formule des probabilités totales 


Cette formule est un corollaire des deux théorèmes fondamen- 
taux : du théorème des probabilités totales et du théorème des pro- 
babilités composées. 

Soit à déterminer la probabilité d'un certain événement 4 pou- 
vant avoir lieu simultanément avec l’un des événements 


H;, H:, ..., H,, 


formant un système complet d'événements incompatibles. Nous 
appellerons ces événements hypothèses. 
Montrons que dans le cas général on a: 


P(4)= À P(HDP(AIH) (3.4.1) 


c'est-à-dire que la probabilité de l'événement À se calcule comme 
la somme des produits de la probabilité de chacune des hypothèses 
par la probabilité de l'événement conditionnellement à cette 
hypothèse. 

La formule (3.4.1) est appelée formule des probabilités totales. 

Démonstration. Les hypothèses JJ;, H;,..., H, formant 
un système complet, l'événement À ne se produit qu’en combinaison 
avec l’une de ces hypothèses: 


A = H,A + HA +...+ H,4A. 
Les hypothèses H;, H;, ..., H, étant incompatibles, les combi- 


naisons H:4, H24,..., H,4 le sont également ; en leur appliquant 
le théorème des probabilités totales on obtient: 


P(4)=P(H14)+ P(H24)+.. +P(Hr4)= à P(H;'). 


4— 2823 
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En appliquant aux événements H,A le théorème des probabilités 
composées on obtient: 


P(4)= 2 P(H:)P(A|H:), 


ce qu'il fallait démontrer. 


Exemple 1. Soient trois urnes identiques, la première contenant deux 
boules blanches et une noire; la seconde trois boules blanches et une noire etla 
troisième deux boules blanches et deux noires. On choisit une urne au hasard 
et on en tire une boule. Trouver la probabilité de tirer une boule blanche. 

Solution. Considérons les trois hypothèses suivantes: 

H; — on choisit la première urne: 
H; — on choisit la seconde urne:;: 
H3 — on choisit la troisième urne 
et l'événement À: «tirage d’une boule blanche». 
Les hypothèses étant équiprobables, on a: 
P (H,) = P (H2) = P (H;) = 1/3. 
Les probabilités conditionnelles de l'événement À sous ces hypothèses sont 
respectivement : 

La formule des probabilités totales conditionnelles donne: 

RE RS EE ES 
RSS SNS 413 2 


Exemple 2. Douze appareils sont en exploitation: trois d’entre eux 
sont fabriqués par l'usine n° 1, quatre par l'usine n° 2 et cinq par l'usine n° 3. 
Les appareils provenant de l'usine n° 1 passent l'essai avec une probabilité 0,9, 
de l'usine n° 2 avec une probabilité 0,8, de l’usine n° 3 avec une probabilité 
0,75. Trouver la probabilité pour qu'un appareil choisi au hasard passe l'essai. 

Solution. Nous allons envisager les hypothèses suivantes: 


H;, — l'appareil choisi provient de l'usine n° 1; 
H: — l'appareil choisi provient de l'usine n° 2; 
H; — l'appareil choisi provient de l'usine n° 3. 
Les probabilités de ces hypothèses sont : 
P (Hi) = 3/12 = 1/4, 
P (M2) = 4/12 = 1/3, 
P (H3) = 5/12. 
Sous ces hypothèses, les probabilités conditionnelles de l'événement 4 : 
« l'appareil a passé l'essai » sont: 
P (A | H:1) = 0,9; 
P (A | H2) = 0,8; 
P (A | H3) = 0,75. 
En utilisant la formule des probabilités totales conditionnelles on obtient : 
P (A) = 1/4-0,9 + 1/3-0,8 + 5/18-0,75 — 0,804. 
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Exemple 3. Deux régulateurs contrôlent le fonctionnement d'un 
moteur. Il est désirable que durant un temps t le moteur fonctionne sans panne. 
En présence des deux régulateurs la panne du moteur peut survenir avec une 
probabilité égale à q: 2; lorsque seul le premier régulateur fonctionne, avec une 
probabilité égale à q, et lorsque les deux régulateurs sont en panne, avec une 
probabilité égale à g2. La fiabilité du premier régulateur est le à P:, celle 
du second à P:. Les éléments se mettant en panne indépendamment les uns 
des autres, trouver la fiabilité totale (probabilité de fonctionnement sans panne) 
du moteur. 

Solution. Considérons les hypothèses suivantes: 

Hi1,2 — les deux régulateurs fonctionnent ; 

H; — seul le premier régulateur fonctionne (le second est en panne); 

H2 — seul le second régulateur fonctionne (le premier est en panne); 

Ho —"les deux régulateurs sont en panne. 
et l'événement A: «l'appareil fonctionne sans pannes. 

Les probabilités des hypothèses énumérées sont : 


P(H1,2)=P1Py P(Hi)=Pi(1—P2) 
P (H2) = P2 (1 — Pi); P (Ho) = (1 — Pi) (1 — P2). 

Les probabilités conditionnelles de l'événement À sous ces conditions sont: 
P(AlHi,a)=1—92; P(Al|H;)=1—-g:; 
P(AÏH>)=1—9g; P (A | Ho) = 1 — qo- 

Selon la formule des probabilités totales conditionnelles: 

P(4)= P3P2(1— Q3, 2) + Pi (1 — P2) (1—g1)+ 

+ Pa — Pa) (— 72 (L — Ps) (1 — P2) (1 — go). 


3.9. Théorème des hypothèses (formule de Bayes) 


Le théorème des hypothèses ou formule de Bayes est un corollaire 
du théorème des probabilités totales et de la formule des probabilités 
totales conditionnelles. 

Nous allons envisager le problème suivant. 

Soit un système complet d'hypothèses incompatibles H,, H2,... 
..., H,. Les probabilités de ces hypothèses avant l'expérience sont 
données et sont respectivement P (H:), P (H2),..., P (H,). L'expé- 
rience a réalisé un certain événement 4. Demandons-nous comment 
. réalisation de cet événement change les probabilités de ces hypo- 
thèses. 

En fait il faut ici trouver la probabilité conditionnelle P (H,]| 4) 
pour chacune des hypothèses. 

En vertu du théorème des probabilités composées on a: 


P (4H) = P (4) P(H:|4) = P(H;) P(AI| Hi) (i=1, 2,...,n) 


ou, en négligeant le premier inembre: 
P(A)P(H;|4)=P(H;)P(A]|H;) (—=1,2,...,n),. 


4® 
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d'où 
P(H;ÿy)P(AIH . 
P(Hi] 4) = <ÉE (i=1,2,...,n). 
En exprimant P (4) selon la formule (3.4.1) on obtient: 


P(H;14)=-GOPOAIBD  =4,2,...,n). (3.5.1) 


> P(H:y)P(AIH:) 
imi 


La formule (3.5.1) est appelée formule de Bayes ou théorème des 
hypothèses. 


Exemple 1. Un appareil peut être monté avec des pièces de haute 
qualité et avec des pièces ordinaires. Dans le premier cas sa fiabilité (probabi- 
lité de fonctionnement sans défaillance) durant le LS t est égale à 0,95; 
dans le second, à 0,7. Environ 40 % des appareils sont fabriqués avec des pièces 
de haute qualité. L'appareil a été soumis à l'essai pen le temps t et s’est 
Avere bon. Trouver la probabilité qu’il soit monté avec des pièces de haute 
qualité. 

Solution. Deux hypothèses suivantes sont possibles : 

H;1 — l'appareil est monté avec des pièces de haute qualité: 


H2 — l'appareil est monté avec des pièces de qualité ordinaire. 
Les probabilités de ces hypothèses avant l'expérience sont: 
P (H3) = 0.4; P (H2) = 0.6. 

L'expérience a donné lieu à l'apparition de l'événement 4 : « fonctionne- 
ment sans défaillance durant le temps ts. 

Les probabilités conditionnelles de cet événement sous les hypothèses X, 
et H;, sont: 

‘ P(AlH;)= 0,95: P (A | H2) = 0,7. 
La formule (3.5.1) permet de trouver la probabilité de l'hypothèse H; après 
l'expérience: 

0,4-0,95 

0.4-0,95 + 0,6-0,6 


Exemple 2. Deux tireurs tirent indépendamment l’un de l'autre sur 
une cible un coup chacun. La probabilité d’atteindre la cible est égale à 0,8 
pour le premier tireur et 0.4 pour le second. Un coup a percé la cible. Trouver 
la probabilité pour que ce soit le coup du premier tireur. 
Solution. Avant l'expérience les hypothèses suivantes sont possibles: 
H; — aucun des deux tireurs n’atteint la cible: 
H: — les deux tireurs atteignent la cible; 
H, — seul le premier tireur atteint la cible; 
H, — seul le second tireur atteint la cible. 


Les probabilités de ces hypothèses sont: 
P (H;) = 0,2-0,6 = 0,12; 
P (H2) = 0,8-0,4 = 0,32; 
P (Hs) = 0,8-0,6 = 0,48; 
P (H,) = 0,2-0,4 = 0,08. 


P(H:)= = 0,475. 
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Les probabilités conditionnelles de l'événement observé À sous ces hypothè- 
ses sont : 


P(A|H)=0; P(A|H:)=0; P(A|H3;)=1; P(4A|Hi)= 1. 


Après l'expérience les hypothèses H, et H, deviennent impossibles. et les 
probabilités des hypothèses H, et H, sont: 
0,481 6 0,08: | 1 


PA = Got 7 PU = GET 7 


Par conséquent, avec une probabilité égale à Lon peut attribuer le trou au 


premier tireur. 

Exemple 3. Deux stations d'observation fournissent des données 
sur un certain système qui peut se trouver dans deux états S, et S:, en passant 
d'une manière aléatoire de l’un à l’autre. De longues observations ont permis 
d'établir que durant environ 30 % du temps le système se trouve dans l'état 
S1, et 70 % dans l’état S:. La station n° 1 fournit des données erronées environ 
dans 2 % de tous les cas. et la station n° 2 dans 8 %. A un certain moment 
la station n° 1 a communiqué que le système se trouve dans l’état S;. et la sta- 
tion n° 2 qu'il est dans l'état S.. 

ER des communications doit être supposée exacte? 

Solution. Il est naturel de supposer vraie celle des communications 
dont la probabilité d'erreur est moindre. Nous allons utiliser la formule de 
Bayes. A cet effet faisons les hypothèses suivantes sur l’état du système: 


H;, — le système se trouve dans l’état S,; 
H; — le système se trouve dans l'état S:. 
L'événement observé À correspond à ce que la station n° 1 a transmis que 
le système se trouve dans l'état S:, et la station n° 2 qu'il se trouve dans l’état 
2: 
Les probabilités des hypothèses avant l'expérience sont: 
P(H)=0,3; P (H2) = 0,7. 
Calculons les probabilités conditionnelles de l'événement observé À pour 


ces hypothèses. Pour que l'événement 4 ait lieu sous l'hypothèse 7, il faut que 
la communication transmise par la première station soit vraie et par la seconde 


erronée : 
P (A | H1) = 0,98-0.08 = 0,0784. 
D'une manière analogue on a: 
P (4 | H2) = 0,92-0,02 = 0,0184. 


En appliquant la formule de Bayes on peut trouver la probabilité pour 
que l’état réel du système soit S, : 
0,3-9,0784 
0,3-0,0784 + 0,7-0,0184 


c'est-à-dire que des deux communications celle de la première station est plus 
vraisemblable. 


P(H:l4)=— 2 0,645, 


CHAPITRE 4 
EXPÉRIENCES RÉPÉTÉES 


4.1. Théorème particulier sur les expériences 
répétées 


Dans les applications pratiques de la théorie des probabilités 
on rencontre souvent des cas où une même expérience ou des expé- 
riences analogues sont répétées de nombreuses fois. Chaque expé- 
rience peut réaliser ou ne pas réaliser un événement 4. Ce qui nous 
intéresse ce n'est pas le résultat de chaque expérience, mais le nom- 
bre de réalisations de l'événement À dans une série d'expériences. 
Par exemple, dans une série de coups tirés sur une cible, ce n'est 
pas le résultat de chaque coup qui nous intéresse en général, mais le 
nombre total d'atteintes. Dans des problèmes de ce genre il y a lieu 
de savoir trouver la probabilité d’un nombre quelconque de réalisa- 
tions d'un événement dans une série d'expériences. Le présent cha- 
pitre est consacré à l'étude de ces problèmes. La solution en est 
assez simple dans le cas où les expériences sont indépendantes. 

Des expériences sont indépendantes si la probabilité de tel ou tel 
résultat dans chacune des expériences ne dépend pas des résultats des 
autres. Par exemple, les expériences consistant à lancer une pièce 
de monnaie un certain nombre de fois sont indépendantes. Tirer des 
cartes d'un jeu de cartes c'est effectuer des expériences indépendantes. 
à condition toutefois que la carte tirée soit chaque fois remise dans 
le jeu et que les cartes soient battues; autrement, ces expériences 
ne sont pas indépendantes. 

Des expériences indépendantes peuvent être effectuées dans les 
mêmes conditions ou dans des conditions différentes. Dans le pre- 
mier cas la probabilité de l’événement À dans toutes les expériences 
est la même, dans le second cette probabilité change d'une expé- 
rience à l’autre. Pour le premier cas il y a lieu d'appliquer le théorème 
particulier des expériences répétées et pour le second le théorème général. 
Nous allons commencer par l'étude du théorème particulier qui est 
plus simple. Considérons d’abord un exemple. ° 


Exemple. Trois coups indépendants sont tirés sur une cible, la proba- 
bilité d'atteindre cette dernière lors de chaque coup est égale à p. Trouver 
la probabilité pour que deux de ces trois coups atteignent le but. 

Solution. Désignons par B: l'événement: « deux balles atteignent 
la cible ». Cet événement peut se réaliser de trois manières différentes : 
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4) le premier et le second coups bons. le troisième raté; 

2) le premier et le troisième coups bons. le second raté; 

3) le second et le troisième coups bons, le premier raté. 

Par conséquent, l'événement B: peut être présenté comme la somme des 
produits des événements: 

B2 =A1A2Âs + A1Â243 + 414243, 
Où A1, A2, A3 désignent les événements d'atteindre la cible lors du premier, 
du second, du troisième coup respectivement et 41, 42, À; les événements de 
rater la cible la première, la seconde et la troisième fois. 

Les trois variantes énumérées de l'événement B; étant incompatibles, et 
les événements composant chaque produit étant indépendants, les théorèmes 
d’addition et de multiplication donnent: è 

P(B:)=pp{—p)+p{A{—p)p+({— p) pr, 


ou, en désignant 1 — p = gq, 


D'une manière analogue, en examinant toutes les variantes 
possibles dans lèsquelles un événement donné peut apparaître un 
certain nombre de fois on peut résoudre le problème général suivant. 

Soient nr expériences indépendantes, pouvant chacune soit réali- 
ser l'événement À avec une probabilité p, soit ne pas le réaliser avec 
une probabilité qg — 1 — p. Trouver la probabilité P,,,, de réaliser 
l'événement À dans ces nr expériences exactement m fois. 

Considérons l'événement B, correspondent à l'apparition de 
l'événement À lors de nr expériences exactement m fois. Cet événe- 
ment peut être réalisé de différentes manières. Nous allons décom- 
poser l'événement B,, en une somme de produits d'événements con- 
sistant en l'apparition ou la non-apparition de l'événement À dans 
une expérience quelconque. Notons À, l'apparition de l'événement À 
dans l'i-ème expérience, et À, la non-apparition de l'événement À 
dans cette i-ème expérience. 

Il est évident que chaque variante de réalisation de l'événement 
Bm (chaque terme de la somme) doit se composer de m apparitions 
de l'événement À et de 7 — m non-apparitions, c'est-à-dire de m évé- 
nements À et de rz — m événements À d'indices différents. Ainsi, 


BA AA Ana AA, À 5 A A+ 
es A A. A, 4:25. À: 


dans chaque produit l'événement À devant figurer m fois et À n — m 
fois. 

Le nombre de combinaisons de ce genre est égal à CF, c'est-à-dire 
au nombre de manières dont on peut choisir dans x expériences les 
m expériences dans lesquelles a eu lieu l'événement À. En vertu 
du théorème de multiplication des événements indépendants la 
probabilité de chacune de ces combinaisons est égale à p”g"-". Les 
combinaisons étant mutuellement incompatibles, en vertu du théo- 


56 EXPÉRIENCES RÉPÉTÉES (CH. 4 


rème d'addition, la probabilité de l'événement B, vaut: 


Ph = pq" +. . + pra" = Cp" n-m 
RE 
"en fois 


Ainsi, on peut formuler de la manière suivante le théorème parti- 
culier des expériences répétées. 

Si on a nr expériences indépendantes, dans chacune desquelles 
l'événement À apparaît avec une probabilité égale à p, la probabilité 
pour que l’événement À apparaisse exactement m fois est donnée 
par la formule 7 


n= Cap, (4.1.1) 


où q = 1 — 

La formule (&. 1.1) décrit la répartition des probabilités entre les 
valeurs possibles d'une certaine variable aléatoire, à savoir du nom- 
bre de réalisations de l'événement À dans nr expériences. 

Les probabilités P,., ayant la forme des termes du développe- 
ment du binôme (q + p}"', la répartition des probabilités du type 
(4.1.1) est appelée loi binomiale. 


4.2. Théorème général des expériences répétées 


Le théorème particulier des expériences répétées n'est applicable 
qu'au cas où la probabilité de l'événement À dans toutes les expé- 
riences est la même. Plus fréquents sont les cas plus compliqués 
où les expériences ont lieu dans des conditions différentes et les 
probabilités de l'événement changent d'une expérience à l’autre. 
Si, par exemple, plusieurs coups sont tirés dans des conditions variées 
(disons, à des distances différentes), la probabilité d'atteindre le but 
peut notablement changer d'un coup à l'autre. 

La méthode de calcul de la probabilité d’un nombre quelconque 
de réalisations dc l’événement est dans ces conditions donnée par le 
théorème général des expériences répétées. 

Supposons qu'on effectue n expériences indépendantes, dans 
chacune desquelles un certain événement À peut apparaître avec une 
probabilité p; ou ne pas apparaître avec une probabilité g, = 1 — p: 
(i = 1, ..., n). Il y a lieu de trouver la probabilité P,., pour 
que x expériences réalisent l'événement À exactement m fois. 

Désignons comme auparavant par B,, l'événement suivant lequel 
. l'événement élémentaire À apparaîtra m fois dans nr expériences. 
Comme précédemment, B, est la somme des produits d'événements 
élémentaires : 


= À, 4; .. AA; .…. An + CE + A,424s CE An-1A4n+ 
+ 4,42 sas Annales ARS An 
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dans chacun des produits l'événement À entre m fois et l'événement 


A n — m fois. Le nombre de ces combinaisons est comme auparavant 
égal à C®, mais les combinaisons ne sont plus équiprobables. 

En appliquant les théorèmes d’addition et de multiplication des 
probabilités pour les événements indépendants on obtient 


Pnn = PiP2 : - - Pmma su Gr ses 
+++ + PaQ2Ps - - : Qn-1Pn + +: +192 --. Qn-mPn-m#1 --- Pns 


c'est-à-dire que la probabilité cherchée est égale à la somme de tous 
les produits possibles dans lesquels les probabilités p entrent m fois 
avec des indices différents et les probabilités g n — m fois avec des 
indices différents. 

Pour composer tous les produits possibles de m lettres p et de 
n — m lettres q avec des indices différents nous employons le procédé 
suivant. Faisons le produit de nr binômes 


Pn (2) = (qi + P12) (g2 + P22) - . . (Qn + Pn2) 
ou dans l'écriture condensée 


Pa ()= [T (a+ pur), 


où z est un paramètre quelconque. 

Proposons nous de trouver dans ce produit de binômes le coeffi- 
cient de z". À cet effet, multiplions les binômes et réduisons les 
semblables. Il est clair que chaque terme contenant z” aura pour 
coefficient le produit de m lettres p d'indices différents et de n — m 
lettres q, et après la réduction des semblables le coefficient de z” 
sera la somme de tous les produits possibles de ce type. Par consé- 
quent, la méthode de recherche de ce coefficient est justement celle 
de calcul de la probabilité P,., du problème d'expériences répé- 
tées. 

La fonction æ, (z) dont le développement suivant les puissances 
du paramètre z a pour coefficients Jes probabilités P,., s'appelle 
fonction génératrice des probabilités Ph,, ou simplement fonction 
génératrice. 

Utilisant la notion de fonction génératrice on peut formuler com- 
me suit le théorème général sur les expériences répétées. 

La probabilité pour que l'événement À apparaisse exactement m 
fois dans r expériences indépendantes est égale au coefficient de z” 
dans l'expression de la fonction 


Pn (2) = Il (gi + puz), 


où p, est la probabilité d'apparition de l'événement À dans la 
i-ème expérience; q = À — pi. 
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Au contraire du théorème particulier, la formulation ci-dessus 
du théorème général des expériences répétées ne donne pas la proba- 
bilité Ph, , sous forme explicite. En principe, il est possible d'écrire 
cette expression, mais elle serait trop compliquée et nous ne la 
donnons pas ici. Néanmoins, sans utiliser cette forme explicite on 
peut quand même écrire le théorème général sur les expériences 
répétées comme une seule formule, soit: 

n n 
[IL (G@i+ pi) = D Pn,n2”. (4.2.1) 
i=1 Mes0 

Les deux membres de l'égalité (4.2.1) expriment une même fonc- 
tion génératrice y, (z) avec cette seule différence que dans le premier 
membre elle est écrite comme un monôme et dans le second comme 
un polynôme. En ouvrant les parenthèses dans le premier membre 
et en réduisant les termes semblables on obtient toutes les probabilités 


Pons Pins +. Pain 


en tant que coefficients des puissances zéro, un, etc. de z. 
Il est évident que le théorème particulier des expériences répétées 
découle du théorème général pour 


Ps — Pr =... = Pa = D; 
Un ==... — Qn = Q: 


Dans ce cas la fonction génératrice devient la n-ième puissance 
du binôme (q + pz): 


Pn (z)=(9+ pz)". 
En développant cette expression suivant la formule du binôme 


On 4: 
n 


(g+pz} = D Crp'g "2", 


m=0 
d'où la formule (4.1.1). 
Notons que tant dans le cas général que dans le cas particulier 
la somme de toutes les probabilités P,,,, est égale à l'unité: 


D Pmin=1. (4.2.2) 
m=0 


Ceci est dû avant tout à ce que les événements Bo, B:;, ..., B, 
forment un groupe complet d'événements incompatibles. Du point 
de vue formel on peut obtenir l'égalité (4.2.2) en posant dans la 
formule générale (4.2.1) z = 1. 

Dans de nombreux cas pratiques en plus de la probabilité P,., 
de réalisation de l'événement À exactement m fois, on a à envisager 
la probabilité d'au moins m réalisations de l'événement À. 
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Désignons par C,, l'événement correspondant à l'apparition de 
l'événement 4 au moins m fois, et par Rm., la probabilité de l’evé- 
nement Cm. Il est évident que 


Cn=BhEBat .…. + B,;, 


d'où en vertu du théorème d'addition 
Rnn= Pmn-t Pm+1, net + Pan, 


ou d'une façon plus condensée 


Rmn= D Pin (4.2.3) 


im 
Il est souvent plus commode de calculer R,,., non pas directe- 
ment par la formule (4.2.3) mais en passant à l'événement opposé: 


m— 1 


Rnn=1— D Pin: (4.2.4) 


i=0 
Exemple 1. Quatre coups indépendants sont tirés sur une même 
cible; les probabilités d'atteinte de ces coups sont respectivement : 
py = 0,1, ps = 0,2; pa =0,3; p; = 0,4. 


ou les probabilités que zéro, un, deux, trois et quatre coups soient portés 
au but: 


Poss Pass Pass Pass Pas: 


Solution. Ecrivons la fonction génératrice: 
4 
pa(z)= [T (ai+ pix) = (0,94 0,12) (0,84 0,22) (0.740,32) (0,6 + 0,42) = 
=! 


= 0,302 + 0,440z + 0,215z° + 0,040z3 + 0,002:€. 
d'où: 
Po.4=0,302; Pise=0,440;  Poa=0,215;  Psa=0,040; Pa,e:=0.002. 


Exemple 2. Quatre coups indépendants sont tirés dans les mêmes 
conditions, la probabilité d'atteinte p étant la moyenne des probabilités p1, 
Pas Ps, PA de l'exemple précédent : 


p=+ (Pi + P2 + Ps + Pa) = 0,25. 


Trouver les probabilités’ 
Pour  Pyss  Poas Pass Pas. 
Solution. En vertu de la formule (4.1.1) on a: 

Po: =9=0,316; 

P:,a = Cipg$ = 0,421 ? 

P;,a = Cip?g? = 0,211; 
P3,4 = Cap°g = 0,047; 

Pas — pt—0,004. 
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Exemple 3. La communication est maintenue avec 5 stations. La 
liaison est parfois interrompue à cause des conditions météorologiques. Les 
stations étant suffisamment éloignées les unes des autres, les arrêts de liaison 
sont indépendants et se produisent avec une probabilité p = 0,2. Trouver la 
probabilité pour qu’à un instant donné la liaison soit maintenue avec au plus 
deux stations. 

Solution. L'événement dont il est question consiste en ce qu'il n'y 
aura pas de communication avec au moins trois stations. En vertu de la formu- 
le (4.2.3) on a: 


Ras = Pa,5 + Pa,s-+ Ps,s = C3-0,23-0,82 + 
+ C$-0,24.0,8+ 0,25 — 0,0512 + 0,0064 + 0,0003 = 0,0579 


Exemple 4. Un système de stations radars poursuit un groupe de 
10 objectifs. Chaque objectif peut être perdu indépendamment des autres avec 
une POPAURS égale à 0,1. Trouver la probabilité de perdre au moins un ob- 
jectif. | 

Solution. La probabilité À; :0 pour qu'au moins un objectif soit perdu 
peut être obtenue par la formule: 


Ri,10 = P1,10+ P2,10 + - - . + P10,10: 


mais il est bien plus simple d’utiliser la probabilité de l'événement contraire, 
consistant en ce qu'aucun objectif n’est perdu, et de la retrancher de l'unité: 


R:,10 = 1— Po,10 = 1 — 0,910 CA 0,65. 


Exemple 5. Un appareil se compose de 8 éléments semblables, mais 
il ne peut fonctionner que si au moins six d’entre eux fonctionnent. Durant 
le temps t chaque élément peut tomber en panne indépendamment des autres 
avec une probabilité égale à 0,2. Trouver la probabilité de la défaillance de 
l'appareil durant le temps 1. 

Solution. Pour que l'appareil soit en panne il faut qu'au moins deux 
des huit éléments cessent de fonctionner. La formule (4.2.4) donne: 


Ri8—=1—(Po.s+ Pi1.8)—1—(0,88+ C1-0,2-0,87) + 0,497. 


Exem pe e 6. Un appareil se compose de cinq éléments; la fiabilité 
(probabilité de fonctionnement sans défaillance durant un temps t) du premier 
élément est p, — 0,9, du second p: — 0,95, du troisième p; — 0,8, du quatriè- 
me p, = 0,85 et du cinquième ps — 0,91. Si aucun élément n’est en panne la 
probabilité de fonctionnement sans défaillance de l'appareil est égale à 1; 
si un des cinq éléments est en panne, cette probabilité est 0,7 ; si plus de deux 
éléments sont en panne l'appareil ne peut fonctionner. 

Trouver la probabilité pour que l'appareil puisse effectuer î:e travail qui 
lui est assigné. 

Solution. Pour résoudre le problème on utilise la formule de la pro- 
babilité totale avec les hypothèses suivantes: 

Ho aucun élément n'est en panne; 

H, un élément est en panne. | 

Pour trouver les probabilités des hypothèses on utilise le théorème général 
des expériences répétées, et on écrit la fonction génératrice comme suit: 


5 
ps (2)= [] (ai+piz)= 
{m1 


— (0,9+0,1z) (0,95+ 0,052) (0,8+- 0,2) (0,85+- 0,152) (0,91 + 0,093)- 


Il n'est pas nécessaire ici de calculer tous les termes du développement 
de la fonction génératrice suivant les puissances de z; il suffit de trouver les 
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deux premiers termes, notamment, 1e terme constant et le terme correspondant 
à la première puissance de z. On a: 


Ps (2) = 0,9-0,95 -0,8 -0,85 -0,91 + (0,1 -0,95 -0,8 -0,85 -0,91 + 
+ 0,9-0,05 -0.8 -0,85 -0,91 + 0,9 -0,95 -0,2-0,85 -0,91 + 
+ 0,9-0,95 -0,8 -0,15 -0,91 + 0,9 -0,95 -0,8 -0,85 0,09) z + . .. — 
= 0,530 + 0,364z + ... 


P (Ho) = 0,530; P (H:) = 0,364. 


En vertu du théorème de la probabilité totale, la probabilité de l’événement 4 
que l'appareil effectuerait le travail qui lui est assigné est égale à: 


P (A) = 0,530 -1 + 0,364-0,7 = 0,784. 


D'où 


CHAPITRE 5 


VARIABLES ALÉATOIRES 
ET LOIS DE RÉPARTITION 


5.1. Suite d'une répartition. 
Polygone d’une répartition 


Dans la partie du cours consacrée aux notions fondamentales 
de la théorie des probabilités nous avons introduit la notion très 
importante de variable aléatoire. Nous développons ici cette notion 
et indiquons les méthodes permettant de décrire et de caractériser 
les variables aléatoires. 

Rappelons qu’on appelle variable aléatoire une grandeur pouvant 
prendre lors d’une expérience telle ou telle valeur, inconnue d'avan- 
ce. On distingue les variables aléatoires discontinues (discrètes) et 
les variables aléatoires continues. L'ensemble des valeurs possibles 
des variables discrètes est dénombrable. Les valeurs possibles des 
variables continues ne peuvent être dénombrées et remplissent d'une 
manière continue un certain intervalle. 

À titre d'exemple de variables aléatoires discrètes on peut citer: 
1) le nombre d'apparitions de face lorsqu'on jette une pièce trois 
fois de suite (les valeurs possibles sont 0, 1, 2, 3); 

2) la fréquence d'apparition de face dans l’expérience précédente 
(les valeurs possibles sont 0, 1/3, 2/3, 1); 

3) le nombre d'éléments défectueux dans un appareil formé de cinq 
éléments (les valeurs possibles sont 0, 1, 2, 3, 

4) le nombre de coups avant la première atteinte de la cible (les 


valeurs possibles sont 1, 2, 3, , A, : 
5) le nombre d étudiants ayant passé leurs examens (les valeurs 
possibles sont 0, 1, 2, , N, où N est le nombre total d'élèves). 


A titre d'exemple de ‘variables aléatoires continues on peut 
citer : 
1) l’abscisse (l’ordonnée) d'un point en mouvement; 
2) la distance du point d'atteinte au centre de la cible; 
3) l'erreur d'un altimètre; 
4) le temps de fonctionnement sans défaillance d'un tube électro- 
nique ; 
5) la durée de vie d’un satellite artificiel de la Terre. 

Convenons de désigner les variables aléatoires par les majuscules 
et leurs valeurs possibles par les minuscules correspondantes. Par 
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exemple, X est le nombre d’atteintes lors de trois coups, les valeurs 
possibles étant x, — 0, z2 = 1, z3 = 2, xi=3. 

Considérons maintenant la variable aléatoire X dont les valeurs 
possibles sont 21, z2, . .., z,. La variable X peut prendre chacune 
d'elles avec une certaine probabilité. Le fait de prendrepour À au 
cours d’une expérience l’une de ces valeurs est la réalisation d'un 
des événements formant le système complet d'événements incompa- 


tibles : 
X = Ti; | 
Ft (5.1.1) 
NT; 


Désignons par p avec l'indice correspondant les probabilités 
de ces événements: 


P(X=zx)=p; P(X=z2)=p:;...; P (X = 2) =pr. 


Les événements incompatibles (5.1.1) formant un système complet, 
On a: 


c'est-à-dire que la somme des probabilités de toutes les valeurs 
possibles d'une variable aléatoire est égale à l'unité. Cette probabilité 
totale est d'une certaine façon répartie suivant les différentes valeurs. 
Donner cette répartition, c'est-à-dire indiquer exactement la :pro- 
babilité de chacun des événements (5.1.1), c'est décrire une variable 
aléatoire du point de vue probabiliste. On établit ainsi la Loi derépar- 
tition de la variable aléatoire. 

On appelle loi de répartition d'une variable aléatoire toute rela- 
tion établissant une correspondance entre les valeurs possibles de 
cette variable aléatoire et leurs probabilités. On dira alors que la 
variable aléatoire suit la loi de répartition en question. 

Voyons comment on peut donner la loi de répartition d'une 
variable aléatoire discrète X. La forme la plus simple est un tableau 
où se trouvent inscrites les valeurs possibles de X et les probabilités 
correspondantes : 


Pulp: P2 [pa 


Nous appellerons ce tableau suite de répartition de X. 

Pour plus de clarté on représente souvent un tableau de réparti- 
tion sous forme d'un graphe, en portant en abscisses les valeurs 
possibles de la variable aléatoire, et en ordonnées les probabilités 
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de ces valeurs. Ce qu'on obtient est appelé diagramme en bâtons. 
En réunissant les extrémités des barres verticales représentant les 
probabilités par des droites, on obtient un polygone de répartition 
(fig. 5.1.1), qui, tout comme le tableau de répartition caractérise 
complètement la variable aléatoire qu'il définit; c'est là une des 
formes possibles de la loi de répartition. 

Il est parfois commode de se servir de l'interprétation mécanique 
d'une loi de répartition. Supposons qu’une certaine masse égale 
à l'unité soit répartie suivant l'axe des abscisses de telle sorte qu'en 


Pi 
| 
| | 
NE 
Pe P, 
[° | + 
| 1 | 
| | | 
| | | | | 
0 Ps 
Ty T? Ty Z, Ts Ze T! 
Fig. 5.1.1 


n points Zi, Z2, . - ., In Se trouvent concentrées les masses p;, ps, . .. 
- + Pn. La Suite de répartition est alors interprétée comme un systè- 
me de points matériels, de masses déterminées, disposés sur l'axe 
des abscisses. 
Considérons quelques exemples de variables aléatoires discrètes 
et leurs lois de répartition. 


Exemple 1. Soit une expérience pouvant donner lieu à l'événement 4. 
La probabilité de réalisation de l'événement À est égale à 0,3. On considère 
la variable aléatoire X représentant le nombre de réalisations de l’événement A 
dans l'expérience en question (c’est-à-dire la variable indicatrice de l'événement 
A qui prend la valeur 1 s'il se réalise et la valeur O dans le cas contraire). Eta- 
blirle tableau de répartition et construire le polygone de répartition de X. 

Solution. La variable X a deux valeurs: 0 et 1. Letableau de répar- 
tition de X est: 

i| 0 | Î 


pi | 0,7 | 0,3 


Le polygone de répartition est représenté sur la eur 5.1.2. 

Exemple 2. Trois coups sont tirés sur une cible. La probabilité d'at- 
teindre la cible avec un coup est égale à 0.4. l’our chaque coup réussi le tireur 
gagne 5 points. Etablir le tableau de répartition du nombre de points gagnés. 


5.1] SUITE D'UNE RÉPARTITION. POLYGONE D’UNE RÉPARTITION 65 


Solution. Désignons par X le nombre de points gagnés. Les valeurs 
possibles de X sont Zy — 0, T2 — 5; T3 — 10. TZ, — 15. 

Les probabilités de ces valeurs sont données par le théorème des expérien- 
ces répétées: 


P1 = 0,63 — 0,216; P2 = CL:0,4-0,62— 0,432 ; 
pa=C3-0,42.0,6—0,288;  pa—0,43— 0,064. 
Le tableau de répartition de X sera: 
if O0 | 5 | 10 | 15 
pi 10,216 | 0,432 | 0,288 | 0,064 
Le polygone de répartition est donné sur la figure 5.1.3. 


Pi 


04 


A 
O1 


70 ns] 
TZ! 
Fig. 5.1.2 Fig. 5.1.3 


Exemple 3. La probabilité de réalisation de l'événement À dans une 
expérience est égale à p. On répète cette ex périence (les reprises étant indépen- 
dantes) jusqu'à la première réalisation de l'événement À, après quoi les expé- 
riences sont arrêtées. Notons X le nombre 
d'expériences effectuées. Trouver le ta- 
bleau de répartition de X. 

Solution. Les valeurs possibles 
de X sont 1,2, 3, ... (théoriquement 
elles ne sont limitées en rien). Pour que 
X prenne la valeur 1 il faut que l’événe- 
ment À ait lieu dans la première expéri- 
ence; la probabilité de cette éventualité 
est égale a p. Pour que X prenne la va- 
leur 2, il faut que dans la première expé- 
rience l'événement À ne se réalise pas 
mais se produise dans la seconde: ceci a 
une probabilité gp, où qg — 1 — p. etc. 
Le tableau de répartition de X est de 
la forme: 


za]112] 3 [---| i [--- 


3 #4 S ZT; 


PR Th © Mecs Fig. 5.1.4 
pul p | pal pa] | pai-1| 
Les cinq premières ordonnées du polygone de répartition pour le cas 
p = q = 0,5 sont montrées sur la figure 5.1.4. | 
Exemple 4. Un tireur tire sur une cible jusqu'à la première atteinte 
ayant à sa disposition 4 cartouches. La probabilité d'atteindre le but lors de 


9 — 2823 


66 VARIABLES ALÉBATOIRES ET LOIS DE RÉPARTITION [CH. 5 


chaque coup est égale à 0.6. Trouver le tableau de répartition des cartouches 
non dépensées. 

Solution. La variable aléatoire X représentant le nombre de cartou- 
ches non dépensées peut prendre quatre valeurs possibles: 0, 1, 2 et 3 avec 
les probabilités : 

Po = 0,45 — 0,064 ; 


P1 =0,42-0,6 — 0,096 : 
P:=0,4-0,6 = 0,240 ; 


Pa = 0,600. 
Lo tableau de répartition de X est: 
zi| 0 1 2 | 3 


pi 0,064 | 0,096 | 0,240 | 0,600 ‘ 
Le polygone de répartition est donné sur la figure 5.1.5. 
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Exemple 5. Un appareil technique peut être utilisé dans différentes 
conditions. Il exige d’être réglé de tem autre suivant les conditions d'utili- 
sation. Choisi pour un certain service. il peut se trouver au hasard dans un régi- 
me favorable ou défavorable. Dans le premier cas il peut être utilisé trois fois 
de suite sans réglage. puis il doit être réglé. Dans le second cas il doit être réglé 
après la première utilisation. La probabilité pour que l'appareil soit dans un 

igime favorable est égale à 0.7. celle d’un régime défavorable vaut 0.3. On con- 
sidère la variable aléatoire X. le nombre d'utilisations de l’appareil avant le 
réglage; trouver le tableau de répartition de X. 

Solution. X peut prendre trois valeurs: 1, 2 et 3. Pour que X = 1 
il faut que dès la première utilisation l'appareil se trouve dans un régime défa- 
vorable, la probabilité de cette éventualité est p, = 0.3. Pour que X = 2 il faut 
que lors de la première utilisation l'appareil se trouve dans un régime favorable 
et lors de la seconde dans un régime défavorable. la probabilité correspondante 
est pa = 0,7 -0,3 = 0.21. Pour que X = 3 il faut que lors des deux premières 
utilisations l'appareil soit dans un régime favorable (après la troisième utili- 
ne réglage est obligatoire) ; la probabilité correspondante est p; = 0.72 = 
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Le tableau de répartition de X est: 
zi| 1 2 3 
pa 10,30 | 0,21 | 0,49 
Le polygone de répartition est donné sur la figure 5.1.6. 


9.2. Fonction de répartition 


Dans le paragraphe précédent nous avons introduit le tableau 
de répartition (suite ordonnée) en tant que caractéristique complète 
(loi de répartition) d’une variable aléatoire discrète. Cependant cette 
caractéristique n'est pas universelle; elle n’a de sens que pour des 
variables aléatoires discrètes. Il est facile de voir que pour une 
variable aléatoire continue cette caractéristique ne peut être utilisée. 
En effet, une variable aléatoire continue a une infinité de valeurs 
possibles remplissant d’une manière continue un certain intervalle 
(ensemble dit non dénombrable). Il est donc impossible de dresser 
un tableau où toutes les valeurs d'une telle variable aléatoire sont 
énumérées. De plus, comme nous allons le voir ultérieurement, 
chaque valeur particulière de la variable aléatoire continue n'a pas 
de probabilité différente de zéro. Cependant les différents domaines 
des valeurs possibles d'une variable aléatoire ne sont pas équi- 
probables, et pour une variable continue il existe une certaine 
répartition des probabilités, bien qu'il faille entendre ceci d’une 
manière quelque peu différente du cas d'une variable discrète. 

Pour caractériser quantitativement cette répartition il est commo- 
de d'utiliser non pas Ja probabilité de l'événement X — x, mais la 
probabilité de l’événemert X << x où x est une certaine valeur cou- 
rante. La probabilité de cet événement dépend évidemment de 7x, 
elle en est une certaine fonction. Cette fonction est appelée fonction 
de répartition de la variable aléatoire X. Il est d'usage de la désigner 
par F (x): 


F(2) = P(X < x). (5.2.1) 


La fonction de répartition est la caractéristique la plus univer- 
selle d’une variable aléatoire. Elle existe pour toutes les variables 
aléatoires, tant discrètes que continues. La fonction de répartition 
caractérise complètement une variable aléatoire du point de vue 
probabiliste, c'est-à-dire se trouve être une des formes de la loi de 
répartition. 

Mentionnons quelques propriétés générales de la fonction de 
répartition. 

1. La fonction de répartition F (x) est une fonction non décrois- 
sante de son argument, c'est-à-dire que pour 2 >zx on a F (x2) > 
> F (x). 
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2. Lorsque l'argument x —> —co, la fonction de répartition est 
égale à zéro: 
F (—0c0) = (. 


3. Lorsque l'argument z —> oo, la fonction de répartition est 
égale à l'unité: 
F (+oo) = 1. 


Sans donner de démonstration rigoureuse de ces propriétés nous 
allons les rendre claires par une interprétation géométrique. A cet 
effet considérons la variable aléatoire X comme un point aléatoire X 


Fig. 5.2.1 


sur l’axe Oz (fig. 5.2.1) pouvant dans l’expérience se situer dans une 
position quelconque. La fonction de répartition F (x) est alors la 
probabilité pour que le point aléatoire X se trouve à gauche du 
point zx. 

Faisons augmenter l’abscisse x, c'est-à-dire déplaçons le point z 
à droite. On comprend aisément que la probabilité pour le point 


Fig. 5.2.2 


aléatoire X de se trouver à gauche de x ne peut alors diminuer; par 
conséquent, la fonction de répartition F (x) ne peut décroître quand zx 
croît. 

Pour voir que F (—c) = 0 on déplace indéfiniment le point z 
vers la gauche. Il devient impossible pour le point X de se trouver 
à la limite à gauche de x; il est naturel de supposer que la probabilité 
de cet événement tend vers zéro, c'est-à-dire que F (—co) = 0. 

De même, en déplaçant indéfiniment le point z à droite on voit 
que F (oo) = 1, car l'événement X << x devient à la limite certain. 
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Le graphique de la fonction de répartition F (x) est dans le cas 
général une courbe non décroissante (fig. 5.2.2) variant de 0 à 1, 
avec des discontinuités éventuelles en certains points. 

Connaïissant le tableau de répartition d'une variable aléatoire 
on peut facilement trouver sa fonction de répartition, En effet, 


F(x)}=P(X<z)= D P(X = x), 
X;CeXx 


où l'inégalité x, < x sous le signe de la somine indique que 
la sommation est étendue à toutes les zx; inférieures à zx. 

Lorsque z passe par une des F(x) 
valeurs possibles de la variable 
discrète X, la fonction varie par 
saut, la grandeur du saut étant 
égale à la probabilité de cette 
valeur possible. 


Exemple 1. On effectue une 
expérience pouvant réaliser ou ne pas 
réaliser l'événement 4. La probabilité de 
réalisation de l'événement 4 est égale 
à 0.3. On considere la variable aléatoire 
X, le nombre de réalisations de l'événe- 
ment À dans l'expérience (variable indi- A 
catrice de l'événement 4). Trouver sa Fig. 5.2.3 
fonction de répartition. 

Solution. Le tableau de répartition de X est: 


af 07]! 


1 2 


pl0,710,3 
Coustruisons la fonction de répartition de X: 
1) pour x < 0 
F(x)=— P(X <z) = 0: 
2) pour0Or<i1i 
F(2)=P(X<rx=P(X=0)=0.7 
3) pour x > 1 
F()=P(X<z)=P(X=0)+P(X =1) = 1. 


La figure 5.2.3 montre le graphique de la fonction de répartition. Aux 
points de discontinuité la fonction F (x) prend les valeurs notées sur la figure 
par des points (la fonction est continue à gauche). 

Exemple 2. Dans les conditions de l'exemple précédent on effectue 
4 expériences indépendantes. Déterminer la fonction de répartition du nombre 
de réalisations de l'événement 4. 

Salution. Désignons par X le nombre de réalisations de l'événement 4 
dans quatre expériences. Voici son tableau de répartition: 


nf 0 | 112 | 3] 4 
pa Vo,2401 lo,&1160,2646l0,075610,0081 
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Construisons la fonction Fu répartition de X: 
1) pour zx S 0 F (x) = 
2) our F (x) = 02401: 


3) pour 1<z<2 F (x) = 0,6517;: 
4) pour 2<z<3 F (x) = 0.9163; 
9) pour 3<z<4 F (x) = 0,9919; 
6) pour zx >> 4 F (z) = 1. 
Sur la figure 5.2.4 on peut voir le graphique de la fonction de réparti- 
tion F (x). 


La fonction de répartition d'une variable discrète quelconque 
est toujours une fonction discontinue en escalier dont les sauts se 
produisent aux points qui sont les valeurs possibles de cette variable 


Fig. 5.2.4 


aléatoire et sont égaux aux probabilités de ces valeurs. La somme 
de tous les sauts (échelons) de la fonction F (x) est égale à l'unité. 

Au fur et à mesure que le nombre de valeurs possibles de la 
variable aléatoire augmente et que diminuent les intervalles entre 
elles, le nombre d'échelons devient plus important et les échelons 
plus petits; la courbe en escalier devient plus continue (fig. 5.2.5); 
la variable aléatoire tend peu à peu vers une variable continue, et 
sa fonction de répartition vers une fonction continue (fig. 5.2.6). 

Généralement, dans les applications pratiques la fonction de 
répartition d'une variable aléatoire continue est une fonction con- 
tinue en tous les points comme on peut le voir sur la figure 5.2.6. 
On peut cependant trouver des exemples de variables aléatoires dont 
les valeurs possibles remplissent d’une manière continue un certain 
intervalle, mais pour lesquelles la fonction de répartition n'est 
pas partout continue mais admet des discontinuités (fig. 5.2.7). 
Ces variables aléatoires sont dites mixtes. On peut citer à titre 
d'exemple la surface de destruction d'une cible par une bombe dont 
le rayon destructif est égal à R (fig. 5.2.8). Les valeurs de cette 
variable aléatoire remplissent l'intervalle compris entre 0 et xA', 
mais les valeurs limites 0 et x AR? de cet intervalle correspondant aux 


| | 
| | 
| | 
|  ) æ. EE : 
a EN | N 
| i | à ñ 
| S | Se | c 
Cu re te 
| 
( ( 
( ( | 
# | 
l R, 
LS 
LES S + © 


F(x) 


72 VARIABLES ALÉATOIRES ET LOIS DE RÉPARTITION {(CH. 5 


positions Z et ZI de la bombe ont une certaine probabilité finie, 
à ces valeurs correspondent des sauts de la fonction de répartition, 
alors que pour les valeurs intermédiaires (position du type 711) 
la fonction de répartition est continue. Pour autre exemple de la 
variable aléatoire mixte on peut citer le temps T de fonctionnement 
sans défaillance d’un appareil soumis aux essais durant le temps £. 
La fonction de répartition de cette variable aléatoire est continue 


» 


partout, à l'exception du point f. 


9.3. Probabilité pour une variable aléatoire 
de tomber dans un intervalle donné 


Dans les applications pratiques souvent il y a lieu de calculer 
la probabilité pour une variable aléatoire de prendre une valeur 
comprise dans certaines limites, entre & et f par exemple. Nous 
appellerons cet événement « l'appartenance de la variable aléatoi- 
re X à l'intervalle compris entre & et f». 

Pour fixer les idées convenons que l'extrémité gauche de l’inter- 
valle (œ, B) lui appartient et l'extrémité droite ne lui appartient 
pas. Alors, exiger que la variable X tombe dans l'intervalle en 
question c’est assurer que l'inégalité suivante soit vérifiée: 


a < À < $. 


Exprimons la probabilité de cet événement à l’aide de la fonction 
de répartition de X. A cet effet considérons les trois événements 
suivants: 


l'événement À consistant en ce que À <$; 
l'événement B consistant en ce que À < «; 
l'événement C consistant en ce que a < X << f$. 


Comme À = B + C, on a en vertu du théorème d'addition des 
probabilités : 


P(X<B)=P(X<a)+P(a< X <) 
ou 
FB=F(a) +P(a< X < B), 
d'où 
P(a<X<B)—=F(B) — F(a), (5.3.1) 


c'est-à-dire que la probabilité pour la variable aléatoire de tomber 
dans un certain intervalle est égale à l'accroissement de la fonction de 
répartition sur cet intervalle. 

Si on diminue indéfiniment le domaine (&, B) en supposant que 
B —+ &, au lieu de la probabilité d'un certain intervalle on obtient 
à la limite la probabilité pour la variable de prendre une valeur 
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particulière «: 
P(X=a)=limP(asX<$B)=lim[F(B)—F(œ)]. (5.3.2) 
Ba Ba 


La valeur de cette limite dépend de ce que la fonction F (x) est 
continue au point z — & ou admet en ce point une discontinuité. 
Si au point « la fonction F (z) a une discontinuité, la limite de 
(5.3.2) est égale à la valeur du saut de la fonction F (x) en ce point. 
Si au contraire la fonction F (x) est continue au point «&, cette limite 
est égale à zéro. 

Ultérieurement nous dirons que des variables aléatoires sont 
continues seulement si leurs fonctions de répartition le sont partout. 
On peut donc formuler la propriété suivante: 

La probabilité d'une valeur quelconque d'une variable continue 
est égale à zéro. 

Nous allons nous arrêter un peu plus en détail sur cette propriété. 
Dans ce cours nous avons déjà rencontré des événements dont la 
probabilité était égale à zéro, il s'agissait d'événements impossibles. 
On voit maintenant que non seulement les événements impossibles, 
mais également les événements possibles peuvent avoir une probabi- 
lité nulle. En effet, l'événement X = «& est possible; cependant 
la probabilité de cet événement est égale à zéro. De tels événements, 
possibles mais avec une probabilité nulle, ne peuvent apparaître: 
que dans des expériences ne se réduisant pas à un système de cas. 

La notion d'événement possible mais avec une probabilité nulle 
peut à première vue paraître paradoxale. En réalité cette notion 
n’est pas plus paradoxale que celle d’un corps ayant une certaine 
masse. alors qu'aucun point à l’intérieur du corps n’a de masse finie. 
Si petit que soit un volume, sa masse est finie; cette masse tend 
vers zéro lorsque le volume diminue infiniment et à la limite est 
nulle pour un point. De même, pour une répartition continue la 
probabilité pour un point aléatoire de tomber dans un intervalle 
aussi petit que l’on veut peut être différente de zéro, alors que la 
probabilité de se trouver en un point déterminé est exactement 
nulle. Soit une expérience dans laquelle la variable aléatoire conti- 
nue À doit prendre une de ces valeurs possibles. Avant l'expérience 
la probabilité de chacune de ces valeurs est nulle; néanmoins dans 
l'expérience la variable aléatoire X prendra obligatoirement l’une 
de ses valeurs possibles, c'est-à-dire que de toute évidence va se 
réaliser l’un des événements de probabilité nulle. 

Si la probabilité de l'événement X = «& est nulle, ceci ne veut 
pas dire que cet événement n'apparaîtra pas, donc que la fréquence 
de cet événement est nulle. On a déjà vu que pour un grand nombre 
d'expériences la fréquence d’un événement n’est pas égale, mais tend 
seulement vers sa probabilité. Le fait que la probabilité de l'événe- 
ment À = « est nulle veut simplement dire que pour un nombre 
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d'expériences indéfiniment grand cet événement se produira aussi 
rarement que l'on veut. 


Si un événement À a une probabilité nulle d'être réalisé dans 


l'expérience en question, l’événement contraire À a une probabilité 
égale à l'unité, néanmoins il n'est pas certain. Pour une variable 
aléatoire continue X pour « quelconque la probabilité de l'événe- 
ment À  « a une probabilité égale à l'unité, cependant cet événe- 
ment n'est pas certain. Si le nombre d'expériences augmente indéfini- 
ment cet événement aura lieu presque toujours, mais pas toujours. 

Dans le paragraphe 5.1 nous avons interprété une variable aléa- 
toire discrète comme une masse unité répartie entre certains points 
isolés de l'axe des abscisses. Dans le cas d’une variable aléatoire con- 
tinue l'interprétation mécanique revient à la répartition d'une masse 
unite non pas en des points isolés, mais continüment sur l’axe des 
abscisses, la masse d'aucun des points n'étant finie. 


9.4. Densité de probabilité 


Soit une variable aléatoire continue X donnée par sa fonction de 
répartilion /‘ (x) que nous supposerons continue et dérivable. Calcu- 
lons la probabilité pour cette variable aléatoire de se trouver dans 
l'intervalle compris entre x et x + Az: 


P(x<X<z+Az)=F(z + Az) —F (x), 


donc l'accroissement de la fonction de répartition sur cet intervalle. 
Considérons le rapport de cette probabilité à la longueur de l'inter- 
valle, c'est-à-dire la probabilité moyenne par unité de longueur de 
l'intervalle et faisons tendre Azx vers zéro. A la limite on obtiendra 
la dérivée de la fonction de répartition: 
lim ÆCHTADZFG) 2 p' (x). (5.4.1) 
Ax—0 àz 


Introduisons la désignation 
f (x) = F' 6x). (5.4.2) 


La fonction f (r) — dérivée de la fonction de répartition —carac- 
térise la densité de la répartition des valeurs de la variable aléatoire 
en un point donné. Cette fonction est appelée densité de répartition des 
probabilités ou plus brièvement densité de probabilité de la variable 
aléatoire continue X. 

Les termes « densité de répartition ». « densité de probabilité » 
deviennent particulièrement clairs si l’on utilise l'interprétation 
mécanique d'une répartition; dans cette interprétation la fonction 
f (x) caractérise littéralement la densité de la répartition des masses 
sur l'axe des abscisses (« densité linéaire »). On a montré sur la 
figure 5.4.1 une courbe de densité de probabilité. 
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La densité de probabilité tout comme la fonction de répartition 
est une des formes de la loi de répartition. Au contraire de la fonction 
de répartition, cette forme n'est pas universelle, car elle n’a de sens 
que pour des variables aléatoires continues. 

Considérons une variable aléatoire continue X de densité de pro- 
babilité f (x) et le domaine élémentaire dr adjacent au point z 
(fig. 5.4.2). La probabilité pour la variable aléatoire X de se trouver 
dans cet intervalle élémentaire (à des infiniment petits d'ordre élevé 


f(x) 


f(x) 


NS 


0 ee 0 I dx T 


Fig. 5.4.1 Fig. 5.4.2 


près) est égale à.f (x) dr. La grandeur f (x) dr est appelée élément 
de probabilité. Du point de vue géométrique c’est l’aire du rectangle 
élémentaire ayant pour base l'intervalle dx (fig. 5.4.2). 

Exprimons la probabilité pour la variable aléatoire À de se 
trouver dans l'intervalle (œ, B) (fig. 5.4.3) en fonction de la densité 
de probabilité. Il est évident que la probabilité cherchée est égale 
à la somme des éléments de probabilité sur tout cet intervalle, 
c'est-à-dire à l'intégrale suivante: 


B 
P(a<X<fp)=— | f(æ)dr *). (5.4.3) 


Du point de vue géométrique la probabilité pour la variable 
aléatoire X de se trouver dans l'intervalle (œ, B) est égale à l'aire 
comprise entre la courbe de densité et l’axe des abscisses et limitée 
par les ordonnées correspondant aux extrémités de l'intervalle («, B) 
(fig. 5.4.3). 

La formule (5.4.2) exprime une densité de probabilité à l’aide 
d’une fonction de répartition. Soit maintenant le problème inverse, 


* La probabilité d'une valeur quelconque d’une variable aléatoire continue 
étant égale à zéro, on peut considérer ici que l'extrémité gauche n'appartient 
pas à l'intervalle (&. B), c'est-à-dire en omettant le signe d'égalité dans a <X <$. 
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c'est-à-dire qu'il y a lieu de trouver une fonction de répartition en 
fonction d'une densité. Par définition on a: 


F(x)=P(X<z)=P(—oœo<X< x), 
alors en vertu de la formule (5.4.3): 


F2) -- | {(x)dr. (5.4.4) 


Du point de vue géométrique, f (x) n'est rien d'autre que l'aire 
comprise entre la courbe de densité et l’axe des abscisses ct se trou- 
vant à gauche du point zx (fig. 5.4.4). 


Enonçons les propriétés essentielles de la densité de probabilité. 
1. La densité de probabilité est une fonction non négative: 


Î (@) 2 0. 


Cette propriété découle immédiatement du fait que la fonction 
de répartition F (x) est unc fonction non décroissante. 

2. L'intégrale prise de —o à —+o de la densité de probabilite 
est égale à l'unité: 

| f(x)dr =1. 

Ceci découle de la formule (5.4.4) et du fait que F (+) = 1. 

Pour les propriétés essentielles de la densité de probabilité on 
peut donner l'interprétation géométrique suivante: 

1) toute la courbe de densité de probabilité se trouve au-dessus 
de l’axe des abscisses; 

2) l'aire totale comprise entre la courbe de densité de probabilite 
et l’axe des abscisses est égale à l'unité. 

Intéressons-nous aux dimensions de la fonction de répartition 
et de la densité de probabilité. La fonction de répartition F (x), 
comme toute probabilité, est une grandeur sans dimension. Quant 
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à la densité de probabilité f(x), on peut voir à partir de la formu- 
le (5.4.1), qu'elle a la dimension inverse de la variable aléatoire. 


Exemple 1. La fonction de répartition de la variable aléatoire X est 
donnée par la formule suivante: 
0 pour r <O0; 
F (x) = | az pour 0<r<1; 
pour x > 1. 
a) Trouver le coefficient a. 
b) Trouver la densité de probabilité f (x). 
€) Trouver la probabilité pour la variable X de se trouver dans l'intervalle 
compris entre 0,25 et 0.5. 
Solution. a) La fonction de répartition de X étant continue. pour 
z=4Âona az = 1. d'où a = 1. 
b) La densité de probabilité de X est donnée par la formule: 
0 pour r < 0; 
f(z) = | 2z pour 0O<r<i; 
O0 pour x > i. 
c) En vertu de la formule (5.3.1) on a: 
P (0,25 << X < 0,5) = F (0,5) — F (0,25) = 0,52 — 0,253 = 0,1875. 


Exemple 2. La variable aléatoire X suit une loi de répartition de 
densité 


f(z)=acos z pour —T<r<T; 


f(z)=0 pour E<—+ ou 2> +. 


a) Trouver le coefficient a. 
b) Tracer le graphique de la densité de la probabilité f (x). 
c) Trouver la fonction de répartition F (x) et tracer son graphique. 


d) Trouver la probabilité pour la variable X de se trouver entre 0 et Ed 


Solution. a) Pour trouver le coefficient a nous utilisons la propriété 
suivante de la fonction de répartition: 


eo 2 
ro Lun dz=2a=1, 


d'où a = 1/2. 
0) _ graphique de la densité de probabilité f (x) est donné sur la figu- 
re 


us HA formule (5.4.4) permet da trouver l'expression de la fonction de 
répartition : 


0 pour z - 


mr 
F(z)=? 1/2(sinz+1) pour TT <i<+ ; 


1 pour z > + : 
Sur la figure 5.4.6 on peut voir le graphique de la fonction F (x). 


f(x) 


= 0 LA LA 
2 4 è 


-Æ 0 JL 
2 A 
Fig. 5.4.6 
F(2) 
Z 
( 


Fig. 5.4.7 
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d) La formule (5.3.1) donne: 


P (o<x <—<+) = + (sin ++1)—5 (sin 0+1 2. 


La formule (5.4.3) Poe! d'obtenir le même résultat mais d’une manière 
un peu plus compliquée. 

Exemple 3. La densité de probabilité de la variable aléatoire X est 
donnée par la formule suivante: 
1 +) 
ARETIE TS 

a) Tracer le graphique de la densité f (x). 

b) Trouver la probabilité pour la variable aléatoire X de se trouver dans 
l'intervalle (—1, +1). 

Solution. a) Le graphique de la densité de probabilité est donné sur 
la figure 5.4.7. 

b) En vertu de la formule (5.4.3) on a: 


1 
dx 1 : 1 
Piero ee ts( er. 


1 


5.5. Caractéristiques numériques des variables 
aléatoires. Leur rôle et leur désignation 


Dans ce chapitre nous avons étudié un certain nombre de caracté- 
ristiques des variables aléatoires appelées lois de répartition. Rappe- 
lons ces caractéristiques: 
pour une variable aléatoire discrète: 

a) la fonction de répartition, 

b) le tableau de répartition (graphiquement le polygone de 
répartition) ; 
pour une variable aléatoire continue: 

a) la fonction de répartition, 

b) la densité de probabilité. 

Chaque loi de répartition est une certaine fonction et il suffit 
d'indiquer cette fonction pour donner une description complète 
de la variable aléatoire du point de vue probabiliste. 

Cependant dans de nombreuses applications pratiques on n'a 
pas besoin d’une caractéristique aussi complète qu'est la loi de 
répartition. Souvent il suffit d'indiquer seulement certains para- 
mètres numériques caractérisant dans une certaine mesure les traits 
essentiels de la répartition étudiée: par exemple, une valeur moyenne 
autour de laquelle se trouvent groupées les valeurs éventuelles de 
la variable aléatoire; un nombre quelconque caractérisant la dis- 
persion de ces valeurs autour de la valeur moyenne, etc. En utilisant 
ces caractéristiques qu'on appelle rumériques, on peut exprimer 


*) Loi dite de Cauchy. 
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toutes les connaissances dont on dispose sur la variable aléatoire 
éludiée d'une manière plus compacte, à l’aide d’un nombre minimal 
de paramètres numériques. 

Les caractéristiques numériques et les manipulations qu’on peut 
effectuer sur elles jouent un rôle de premier plan en théorie des 
probabilités. L'utilisation des caractéristiques numériques facilite 
la résolution de nombreux problèmes. Très souvent on arrive à résou- 
dre le problème définitivement sans faire recours aux lois de répar- 
tition, se bornant aux seules caractéristiques numériques. Ce qui 
est important c'est que lorsque dans un problème on a affaire à un 
grand nombre de variables aléatoires, chacune intervenant d'une 
certaine manière dans le résultat numérique de l’expérience, la loi 
de répartition de ce résultat peut en une grande mesure être considérée 
comme indépendante des lois des différentes variables du problème (on 
voit ainsi apparaître la loi dite normale). Dans ces cas pour trou- 
ver, et ceci avec assez d’exactitude, la loi de répartition de la somme 
on n'a pas besoin des lois de répartition des variables aléatoires 
figurant dans le problème ; il suffit d’en connaître certaines caractéris- 
tiques numériques. 

En théorie des probabilités et en statistique théorique on fait 
usage d’un grand nombre de caractéristiques numériques qui diffèrent 
par leur rôle et les domaines d'application. Nous allons étudier ici 
quelques-unes d’entre elles, utilisées le plus souvent 


5.6. Caractéristiques de position 
(espérance mathématique, mode, médiane) 


Parmi les caractéristiques numériques des variables aléatoires 
il faut tout d'abord distinguer celles qui caractérisent la position 
de la variable aléatoire sur l’axe numérique, c'est-à-dire celles 
qui indiquent une certaine valeur moyenne, approchée, autour de 
laquelle se trouvent groupées toutes les valeurs possibles de la varia- 
ble aléatoire étudiée. 

La valeur moyenne d’une variable aléatoire est un certain nombre 
en quelque sorte représentatif de cette variable et pouvant la rempla- 
cer dans les calculs approchés. Lorsque l’on dit que le temps moyen 
de fonctionnement d’un tube électronique est égal à 100 heures 
ou que le point moyen d'impact se trouve déplacé par rapport à la 
cible de deux mètres à droite, on mentionne une certaine caracté- 
ristique numérique de la variable aléatoire, décrivant sa position 
sur l’axe numérique, c'est-à-dire sa caractéristique de position. 

Parmi les caractéristiques de position l'espérance mathématique 
d'une variable aléatoire, appelée parfois valeur moyenne, occupe 
en théorie des probabilités un rôle de choix. 

Soit la variable aléatoire discrète À qui prend les valeurs possi- 
bles x1, z2, . . ., x, avec les probabilités respectives p1, pa, . . .-, Pa. 
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I1 y a lieu de caractériser par un nombre quelconque la position 
des valeurs de cette variable aléatoire sur l'axe des abscisses, compte 
tenu du fait que ces valeurs ont des probabilités différentes. À cet 
effet il est tout naturel d'utiliser les moyennes pondérées des valeurs 
z;, les poids étant pris proportionnels aux probabilités de ces valeurs. 
Ainsi nous calculerons la valeur moyenne de la variable aléatoire X 
que nous désignerons par M [X]: 


__ LP + Z2P2 +... +TnPa _ iæt 
MIRE Pit P2t--.+Pn à ’ 


ñn 
ou compte tenu de > p;=1, 
=! 


n 


M IX] = 2 Ti Pie (5.6.1) 


= 


Cette moyenne pondérée est appelée espérance mathématique 
de la variable aléatoire. Nous avons donc introduit une des notions 
fondamentales de la théorie des probabilités, à savoir la notion d’es- 
pérance mathématique. 

On appelle espérance mathématique d'une variable aléatoire la 
somme des produits de toutes les valeurs possibles de cette variable par 
les probabilités de ces valeurs. 

Notons que dans la formulation ci-dessus la définition de l'espé- 
rance mathématique n'est en toute rigueur applicable qu aux 
variables aléatoires discrètes; plus loin nous montrerons comment 
cette notion se généralise au cas continu. 

Pour rendre la notion d'espérance mathématique plus claire nous 
allons revenir à l'interprétation mécanique de la répartition des 
valeurs d’une variable aléatoire discrète. Imaginons sur l'axe des 
abscisses les points d’abscisses z1, z2, . . ., zx, où se trouvent concen- 


n 
trées les masses P4, De, - . » Pns AVEC D, pr = 1. Il est alors évident 
{=1 


que l'espérance mathématique donnée par la formule (5.6.1) n'est 
rien d'autre que l'abscisse du centre de gravité du système donné de 
points matériels. 

L'’espérance mathématique d'une variable aléatoire X est liée 
à la moyenne arithmétique des valeurs observées dans un grand nombre 
d'expériences par une relation pareille à celle qui existe entre la 
fréquence relative et la probabilité ; plus sxactement, pour un grand 
nombre d’expériences la moyenne arithmétique des valeurs observées 
d’une variable aléatoire tend (converge en probabilité) vers son 
espérance mathématique. La relation existant entre la fréquence 


6—2823 
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et la probabilité entraîne une relation analogue entre la moyenne 
arithmétique et l’espérance mathématique. 

En effet, considérons une variable aléatoire discrète X donnée 
par le tableau de répartition: 


1] ]22)| sue | Zn 
—————— ;, 
Pi | pilp2! …. | Pn 

où ps; = P(X = z;). 

On effectue N expériences indépendantes dans chacune desquelles 

X prend une certaine valeur. Supposons que la valeur z, est observée 
m1 fois, la valeur x, m, fois et en général la valeur z,, m, fois. 
Il est évident que 


n 
ÿ mi = N. 


Calculons la moyenne arithmétique des valeurs observées laquelle 
à la différence de l'espérance mathématique M [X] sera désignée 
par M* [Xl]: 


M°* [X] = HP Sama ee Penn 


= +2 NT -+imn N_— 


n 
m2? Mn D m. 
! e 


Mais + n'est rien d'autre que la fréquence (ou la probabilité 


statistique) de l'événement XÀ = z;; nous désignerons cette fré- 
quence par pi. On a alors: 


M° [À] 2 ZIP 


c'est-à-dire que la moyenne arithmétique des valeurs observées 
d’une variable aléatoire est égale à la somme des produits de toutes 
les valeurs possibles de cette variable aléatoire par la fréquence 
de ces valeurs. 

Lorsque le nombre d'expériences V augmente les fréquences pf 
tendent (convergent en probabilité) vers les probabilités correspon- 
dantes ps, par conséquent la moyenne arithmétique M* [X] des 
valeurs observées de X tendra (convergera en probabilité) vers son 
espérance mathématique M [X1. 

La relation démontrée ci-dessus entre la moyenne arithmétique 
et l'espérance mathématique est l’une des variétés de la loi des grands 
nombres. Nous en donnerons la démonstration rigoureuse au cha- 
pitre 13. 
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Nous savons déjà que toutes les formes de la loi des grands nom- 
bres sont la constatation du fait de la stabilité de certaines moyennes 
pour un grand nombre d'expériences. Il s'agit ici de la stabilité 
de la moyenne arithmétique d'une série d'observations d'une même 
grandeur. Lorsque le nombre d'expériences n’est pas important, 
la moyenne arithmétique de leurs résultats est aléatoire ; avec aug- 
mentation du nombre d'expériences elle a tendance à se stabiliser, 
en convergeant vers une grandeur constante qu'est l’espérance mathé- 
matique. 

La stabilité des moyennes pour un grand nombre d expériences 
peut facilement être vérifiée expérimentalement. Par exemple, pour 
trouver le poids exact d’un corps quelconque on le pèse dans un 
laboratoire sur une balance de précision, chaque pesée fournit une 
nouvelle valeur ; pour diminuer l'erreur d'observation on pèse le corps 
plusieurs fois et l'on prend la moyenne arithmétique des valeurs 
relevées. Il est facile de voir que si l’on continue à augmenter le 
nombre d’ expériences (pesées), la moyenne arithmétique est de 
moins en moins influencée par cette augmentation et lorsque le 
nombre d'expériences est suffisamment important, elle ne change 
pratiquement plus. 

La formule (5.6.1) de l'espérance mathématique correspond aux 
cas d’une variable aléatoire discrète. Pour une variable continue X 
l'espérance mathématique n'est évidemment plus une somme, mais 
une intégrale, soit: 


MIX] = | z f(x)dz, (5.6.2) 


où f(x) est la densité de probabilité de X. 

La formule (5.6.2) peut être obtenue à partir de la formule (5.6.1) 
à condition d'y remplacer les valeurs x; par le paramètre zx variant 
d'une manière continue, les probabilités correspondantes p, par 
l'élément de probabilité f (x) dx et la somme finie par une intégrale. 
Nous utiliserons souvent dans la suite cette méthode de généralisa- 
tion des formules démontrées pour le cas des variables discrètes. 

Dans l'interprétation mécanique, l'espérance mathématique d'une 
variable aléatoire continue conserve le même sens, celui de l’abscisse 
du centre de gravité d'une barre dont la masse est répartie d'une 
manière continue avec la densité f (x). Cette interprétation permet 
souvent de trouver l' espérance mathématique sans procéder au 
ee, de l'intégrale (5.6.2), ceci à partir des considérations physiques 
simples. 

Ci-dessus nous avons introduit la désignation M [X] pour l'espé- 
rance mathématique de X. Dans certains cas, lorsque la grandeur 
M [X1 entre dans les formules comme un nombre donné, il est plus 
commode de la désigner par une seule lettre. Nous adoptons la dési- 


6* 
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gnation m,: 
m; = M IX]. 


Nous employerons dans la suite les désignations m, et M [X] 
pour l'espérance mathématique parallèlement, en choisissant celle 
qui se trouve être la plus commode. 

Il faut noter que l'espérance mathématique, caractéristique 
essentielle de position, n'existe pas pour toutes les variables aléatoi- 
res. On peut trouver des exemples de variables aléatoires n'ayant 
pas d'espérance mathématique, car la somme ou l'intégrale corres- 
pondantes sont divergentes. 

Considérons par exemple la variable aléatoire discrète X donnée 
par le tableau de répartition suivant: 


zi| 2 | 21 [---| 2! | --- 


CAR ES 


ñn 
Il est facile de vérifier que >) ps — 4, cependant la somme 
mi 


1 


Pt| 5 


©) zip est ici divergente et par conséquent l'espérance mathémati- 
i=1 
que de X n'existe pas. De tels cas n'ont pas d'intérêt pratique car 
généralement les variables aléatoires auxquelles on a affaire ont des 
valeurs limitées et leur espérance mathématique existe sans aucun 
doute. 
Ci-dessus nous avons donné les formules pour l'espérance mathé- 
matique des variables aléatoires discrètes (5.6.1) et continues (5.6.2). 
Si la variable X est du type mixte, son espérance mathématique 
est donnée par la formule: 


MIX] = D zip: + | zF' (x) dz, (5.6.3) 


la somme s'étendant à tous les points zx, où la fonction de réparti- 
tion admet une discontinuité, et l'intégrale, à tous le intervalles 
de répartition continue. 

En plus de l'espérance mathématique, caractéristique essentielle 
de position d’une variable aléatoire, on utilise parfois d’autres 
caractéristiques de position, en particulier le mode et la médiane. 

On appelle mode d'une variable aléatoire sa valeur la plus pro- 
bable. Le terme de « valeur la plus probable » n'est applicable en 
toute rigueur qu'aux variables discrètes; pour une variable continue 
le mode est la valeur pour laquelle la densité de probabilité est 
maximale. On désigne le mode par la lettre «#. Sur la figure 5.6.1 
on peut voir le mode dans le cas discret et sur la figure 5.6.2 dans le 
cas continu. 


Fig. 5.6.1 


f(x) 


Fig. 5.6.2 


Fig. 5.6.3. 


f(x) 
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Si le polygone de la répartition (densité de probabilité) a plus 
ae maximum, la répartition est dite polymodale (fig. 5.6.3 et 
5.6.4). 

Parfois on rencontre des répartitions ayant non pas un maximum 
mais un minimum (fig. 5.6.5 et 5.6.6). Ces répartitions sont dites 
antimodales. À titre d'exemple de répartition antimodale on peut 
citer la Joi obtenue dans l'exemple 5 du $ 5.1. 

Dans le cas général le mode et l'espérance mathématique d'une 
variable aléatoire ne coïncident pas. Cependant dans le cas parti- 
culier, où la répartition est symétrique et unimodale (c'est-à-dire 
a un mode) et où l'espérance mathématique existe, celle-ci coïncide 
avec le mode et le centre de symétrie de la répartition. 

Mentionnons encore une caractéristique de position, à savoir 
la médiane d'une variable aléatoire. Il est d'usage d'employer cette 
caractéristique seulement pour des variables aléatoires continues, 
bien que du point de vue formel elle puisse également être utilisée 
pour une variable discrète. 

On appelle médiane d'une variable aléatoire X sa valeur #e 


telle que 
P(X <he) = P(X > #e), 


c'est-à-dire que la variable aléatoire considérée a même probabilité 
d’être inférieure ou supérieure à #e. Du point de vue géométrique, 
la médiane est l’abscisse du point divisant en deux parties égales 
l'aire limitée par la courbe jf (x) et l'axe des abscisses (fig. 5.6.7). 

Dans le cas d’une répartition modale et symétrique, la médiane 
coïncide avec l'espérance mathématique et le mode. 


5.7. Moments. Variance. Ecart quadratique moyen 


En plus des moyennes, qui sont les caractéristiques de position, 
on utilise également certaines autres caractéristiques des réparti- 
tions. Les moments sont les plus courantes de ces caractéristiques. 

En mécanique on utilise couramment la notion de moment pour 
décrire la répartition des masses (moments statistiques, moments 
d'inertie, etc.). En théorie des probabilités la notion de moment 
a à peu près la même signification. Dans les applications pratiques 
le plus souvent ou utilise les moments initiaux et les moments 
centrés. 

On appelle moment initial d'ordre s_ d'une variable aléatoire 
discrète X et on note «&. [X] la somme 


n 


&s [X] — D ZiPi- (5.7.1) 


Il est facile de voir que cette définition coïncide avec celle du moment 
initial d'ordre s utilisée en mécanique si l'on considère que les 


88 VARIABLES ALÉATOIRES ET LOIS DE RÉPARTITION (CH. 5 


MASSES Di, P2r + - -» Pn Se trouvent concentrées aux points zy, Z2, . . - 
CE Ln° 
Dans le cas d’une variable aléatoire continue X on appelle 
moment initial d'ordre s l'intégrale 


as [À] = Î z'f (x) dz. (5.7.2) 


On voit aisément que la caractéristique principale de position 
introduite dans le paragraphe précédent, à savoir l'espérance mathé- 
matique, n'est rien d'autre que le moment initial d'ordre À de X. 

En utilisant le signe d'espérance mathématique on peut réunir 
en une seule les formules (5.7.1) et (5.7.2). En effet, les formules (5.7.1) 
et (5.7.2) ont la même structure que (5.6.1) et (5.6.2), avec cette 
seule différence qu'à la place de z, et x on a respectivement zri et x’. 
On peut donner alors une définition générale du moment d'ordre s, 
applicable tant pour les variables discrètes que continues: on appelle 
moment initial d'ordre s de X l'espérance mathématique de la s-ième 
puissance de X, soit *): 

[e 4 [X] = M [X°]. (5.7.3) 


Avant de donner la définition du moment centré introduisons 
la notion de variable aléatoire centrée. 
Soit une variable aléatoire X d'espérance mathématique m.. 
e 


On appelle variable aléatoire centrée associée à X et on note X la 
différence 


X = X — m.. (5.7.4) 


Il est facile de voir que l'espérance mathématique d'une variable 
aléatoire centrée est nulle. En effet pour une variable discrète on a: 


MIX]=M X—mil= D (am) p= 


=D aps À p=me-me=0. (5.75) 


Dans le cas continu on a le même résultat. 

Le centrage d'une variable aléatoire est de toute évidence équi- 
valent à la translation de l'origine au point moyen, « central», 
dont l'abscisse est égale à l'espérance mathématique. 

Les moments d'une variable aléatoire centrée sont appelés 
moments centrés. Ils sont analogues aux moments par rapport au 
centre de gravité en mécanique. 


*) Nous préciserons dans le chapitre 10 la notion d'espérance mathéma- 
tique d’une fonction d'une variable aléatoire. 
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Ainsi, on appelle moment centré d'ordre s de X l'espérance mathé- 
matique de la s-ième puissance de la variable centrée associée à X : 


Lis X1=M IX] = MIX—m,)]. (5.7.6) 


Pour une variable aléatoire discrète le moment centré d'ordre s 
est donné par la somme 


b= 2 (zi— m2) pu, (5.7.7) 
et pour une variable aléatoire continue par l'intégrale 
Hs— | (z— mx)" f(x) dr. (5.7.8) 


Dans la suite, quand il ne peut y avoir de doute quant à la 
grandeur à iaquelle correspond le moment en question, pour simpli- 
fier Ed on écrira simplement a, et u, au lieu de a, [X] et 
Us (XI. 

Il est évident que pour toute variable aléatoire le moment centré 
d'ordre 1 est nul: 


ui = MIX] = MIX —m,l =0, (5.7.9) 


car l'espérance mathématique d’une variable centrée est toujours 
nulle. 

Cherchons les relations existant entre les moments centrés et 
initiaux de différents ordres. La démonstration sera donnée seule- 
ment pour le cas des variables discrètes ; il est facile de voir que des 
relations identiques existent pour les variables continues, pour s’en 
convaincre il suffit de remplacer les sommes finies par des intégrales 
et Îles probabilités par des éléments de probabilité. 

Considérons maintenant le moment centré deux: 

° Lo 
pe=MIXN= 2 (im) pie 
im 


n 


n n 
= 2 zip; —2m, } zipi+mi 2 Pi= Ge — 2m + mi = 2 — mL. 
1 = 


i1=) 
D'une manière analogue pour le moment centré trois on obtient: 


ñn 


Us = M [X3] = à (ci ms) pi = 2 Tipi — 3m x 2 zipi + 
= i= 


{ 
n n 
+ 3m 2 Zipi— mx 2 Pi = Gs — 3azm, + 2m2. 
1= 1= 


Les expressions pour u4, us, etc. peuvent être obtenues d’une 
manière analogue. 
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Pour les moments centrés d’une variable aléatoire quelconque X 


on a donc: 
Li = 0, | 
Ue = QG — MX, 
= Gy— Amxcs-+ 2m, (5.7.0) 


Dans le cas général on peut envisager les moments non seulement 
par rapport à l'origine des coordonnées (moments initiaux) ou 
à l'espérance mathématique (moments centrés), mais également 
par rapport à un point quelconque a: 


Ys=MI(X—a)]. (5.7.11) 


Cependant les moments centrés ont devant tous les autres l’avan- 
tage suivant : le premier moment centré est toujours nul et le moment 
centré deux est minimal. Nous allons démontrer cette dernière 
assertion. Pour une variable aléatoire discrète X, pour s — 2, la 
formule (5.7.11) s'écrit : 

n 


v= 2 (zi— a} pi. (5.7.12) 


On peut transformer cette expression de la manière suivante: 


n n 
Y2= 2 (ti mit mr aŸ pi = 2 (ci m;Ÿ pi — 


— 2(m;— a) à (ti— mx) pi+ (mx — aŸ = pr +(m,—a). 


I1 est évident que cette grandeur est minimale pour m, = a, 
c'est-à-dire lorsque le moment est pris par rapport au point m.…. 

Pour caractériser une variable aléatoire on utilise le plus souvent 
le moment initial d'ordre 1 (espérance mathématique) m, = a: 
et le moment centré deux 1h. 

Le moment centré deux de X s'appelle variance de X. Vu l'im- 
portance de cette caractéristique on introduit pour elle la désignation 
spéciale D [X1: 


U2 —= D [X]. 
Par définition du moment centré, on a: 
D IX] = M IX]. (5.7.13) 


c'est-à-dire que la variance de X est l'espérance mathématique du 
carré de la variable centrée associée. 
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En remplaçant dans l'expression (5.7.13) la grandeur X par 
son expression On a: 


D{X]=M I(X— m.)]. (5.7.14) 
Pour le calcul direct de la variance on peut utiliser les formules: 


DIX1= 2 (z1— m.} Pt (5.7.15) 


DIX] = | (z— m;} f(x) dx (5.7.6) 
pour les variables discrètes et continues respectivement. 

La variance d'une variable aléatoire caractérise la dispersion 
de ses valeurs au voisinage de son espérance mathématique. 

En faisant appel à l'interprétation mécanique de la répartition 
on voit que la variance n'est rien d'autre que le moment d'inertie 
de la répartition en question des masses par rapport au centre de 
gravité (à l'espérance mathématique). 

La variance a la dimension du carré de la variable aléatoire. 
Pour mieux caractériser la dispersion, plus commode est d’utiliser 
une grandeur dont la dimension est celle de la variable aléatoire. 
A cet effet, on prend la racine carrée .de la variance. La grandeur 
ainsi obtenue est appelée écart quadratique moyen de X ou écart 
type de X. On désigne l'écart quadratique moyen par © {X]: 


o [X] = VD IX]. (5.7.17) 


Pour simplifier l'écriture on utilise souvent des désignations 
abrégées ©, et D. de l'écart quadratique moyen et de la variance. 
Quand il ne peut y avoir confusion quant aux grandeurs auxquelles 
ces caractéristiques se rapportent, on omet l'indice z, en écrivant 
simplement © et D. 

Dans les applications pratiques on exprime souvent la variance 
d'une variable aléatoire en fonction de son moment initial deux 
[seconde formule (5.7.10)]: 


Dr=— mi. (5.7.18) 


L'espérance mathématique m., et, la variance D, (ou l'écart 
quadratique moyen ©.) sont les caractéristiques le plus souvent 
utilisées d'une répartition. Elles caractérisent ses traits essentiels, 
à savoir sa position et son degré de dispersion. Pour en donner une 
description plus détaillée, on fait appel à des moments d'ordre 
supérieur. 

Le moment centré trois caractérise l’asymétrie d’une répartition. 
Si la répartition est symétrique par rapport à l'espérance mathéma- 
tique (ou, dans l'interprétation mécanique, la masse est répartie 


. 
LS 
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symétriquement par rapport au centre de gravité), tous les moments 
impairs (s'ils existent) sont nuls. En effet, dans la somme 


n 
Hs — D (zi—m;)" pi, 
i= 


lorsque la loi de répartition est symétrique par rapport à m, ets 
est impair, à chaque terme positif correspond un terme négatif égal 
en valeur absolue, de sorte que la somme est nulle. Il en est de même 
pour l'intégrale 


= | (—m) f(x)dr, 


qui est nulle, car c'est une intégrale d’une fonction impaire prise 
dans des limites symétriques. 

Il est donc naturel pour caractériser l'asymétrie d’une répartition 
de prendre l’un des moments impairs, dont le plus simple est le 


f(x) 


(4 M My 
Fig. 5.7.1 


moment d'ordre trois. Il a la dimension du cube de la variable aléa- 
toire: pour obtenir une caractéristique sans dimension on divise 
le moment trois u, par le cube de l'écart quadratique moyen. La gran- 
deur ainsi obtenue est appelée coefficient d'asymétrie ou simplement 
asymétrie; nous désignerons cette grandeur par Sk: 


Sk= #2. (5.7.19) 


Sur la figure 5.7.4 on peut voir deux répartitions asymétriques, 
l’une d'elles (courbe 2) a une asymétrie positive (Skx => 0); l'autre 
(courbe J1) est à asymétrie négative (Sk << 0). 

Le moment centré quatre sert à caractériser l’aplatissement de 
la courbe de répartition, c’est-à-dire montre combien la répartition 
est pointue ou aplatie. Cette propriété de la répartition est donnée 
par le coefficient d'aplatissement. On appelle coefficient d’aplatisse- 
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ment d’une répartition et on note Ex la grandeur 
ea _ | 
Er=— 3: (5.7.20) 
Es , Car pour le cas très 
important que l'on rencontre dans les applications pratiques, cas 


On retranche le nombre 3 du rapport 


de la loi normale (que nous étudierons en détail plus loin), on a Es = 


= 3. Donc le coefficient d'aplatissement de la loi normale est égal 


IN(Ez< 0) 


Fig. 5.7.2 


* 


à zero; les courbes plus pointues ont un coefficient d'aplatissement 
positif ; les courbes plus aplaties ont un coefficient d'aplatissement 
négatif. 

Sur la figure 5.7.2 on peut voir une répartition normale (cour- 
be 7), une répartition à coefficient d'aplatissement positif (cour- 


« 


be ZI) et une répartition à coefficient d'aplatissement négatif 
(courbe ZIT). 
En plus des moments initiaux et centrés, on utilise parfois dans 


les applications pratiques les moments absolus correspondants, donnés 
par les expressions: 


B=MIIX:; w=MIIX/. 
On remarque que les moments absolus d'ordres pairs coïncident 


avec les moments ordinaires. 


Parmi les moments absolus 1e plus employé est le moment absolu 
centré d'ordre 1: 


mw=MIIXI=MIIX—m,ll, (5.7.21) 


appelé écart arithmétique moyen. Tout comme la variance et l'écart 
quadratique moyen, l'écart arithmétique moyen caractérise égale- 
ment la dispersion d'une répartition. 

L'espérance mathématique, le mode, la médiane, les moments 
initiau” et centrés et, en particulier, la variance, l’écart quadratique 
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moyen, les coefficients d'asymétrie et d'aplatissement sont les 
caractéristiques numériques les plus usuelles des variables aléatoires. 
Dans de nombreux problèmes il arrive qu’on ne peut pas déterminer 
la loi de répartition ou bien on n’en a pas besoin. On se limite alors 
à la description approchée de la variable aléatoire à l’aide des caracté- 
ristiques numériques, chacune d'elles exprimant une des propriétés 
essentielles de la répartition. 

On se sert souvent des caractéristiques numériques en approchant 
une répartition par une autre; on s'efforce, en général, de conserver 
certains moments importants. 


Exemple 1. On effcctue une expérience dans laquelle l'événement À 
peut être réalisé avec la probabilité p, ou ne pas être réalisé. Soit la variable 
aléatoire X représentant le nombre de réalisations de l’événement A (variable 
indicatrice de l’événement A). Trouver son espérance mathématique, sa varian- 
ce et son écart quadratique moyen. 

Solution. Le tableau de répartition de X est: 


z]0|1 
milalp 


où g = 1 — p est la probabilité de la non-réalisation de l'événement 4. 
L'espérance mathématique de X est donnée par la formule (5.6.1): 


me = MIX]=0-g+1-p= p, 
et la variance de X par ia formule (5.7.15): 
Dx=D{X]=(0—p}.q+(1— p}? p= pq, 


0, = Vpg. 


(Le lecteur peut obtenir le même résultat en exprimant la variance en fonction 
du moment initial deux). 

Exemple 2. Trois.coups indépendants sont tirés sur une cible; la 
probabilité d'atteindre le but avec chaque coup est égale à 0,4. Soit la variable 
aléatoire X représentant le nombre de coups réussis. Trouver l’espérance mathé- 
matique, la variance, l'écart quadratique moyen et le coefficient d'asymétrie 
de X. 
Solution. Le tableau de répartition de X est: 


2110 [1 [2  |3 
P110,216 | 0,432 | 0,288 | 0,064 
Le calcul des caractéristiques numériques de X donne: 


m; = 0-0,216 + 1-0,432 + 2-0,288 + 3-0,064 = 1.2; 
D, = (0 — 1,2)2-0,216 + (1 — 1,2)2-0,432 + (2 — 1,2)2-0,288 + 


+ (3 — 1,2)3-0,064 = 0,72; 
Oy = VD, = V/0,72 = 0,848 ; 
us = (0 — 1,2)9-0,216 + (4 — 4,2)%-0,432 + 

+ (2— 1,2)-0,288 + (3 — 1,2)9-0,064 = 0,144; 


_ Hs, 0,144 | 
Sk=— où 0,72-0,848 Le 0,236. 


d’où 
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Notons qu'on aurait pu calculer ces mêmes caractéristiques bien plus faci- 
lement en appliquant les théorèmes sur les caractéristiques numériques des 
fonctions (voir chapitre 10). 

Exemple 3. On effectue une série d'expériences indépendantes jusqu’à 
la première réalisation de l'événement À (voir exemple 3 du $ 5.1). Dans chaque 
expérience la probabilité de l'événement À est égale à p. Trouver l'espérance 
mathématique, la variance et l'écart quadratique moyen du nombre X d'expé- 
riences à effectuer. 

Solution. Le tableau de répartition de X est: 


1112] 3 |...| l les 
pilplgpla2pl...|ai-1p |... 
L espérance mathématique de X est donnée par la somme de la série: 
mx=1-p+2-gp+3-gp+ ...+tqgiip+ = 
= p(1+29+392+ ...+igi1+...). 


Il est facile de voir que l'expression entre parenthèses provient de la déri- 
vation de la progression géométrique suivante: 


g+ + a+... ait. = 
Par conséquent: 


: d ‘1 1 1 
ES EUb ni D CE D A DS (1— 4} nr ; 
d'où 
ere 
- P 


s Pour déterminer la variance de X, calculons d'abord son moment initia} 
eux : 


œ 
aa= D zipi=12.p+22.gp+32.q2p+ ...+it-giip+t... = 
1= 1 ‘ 


= p(12+22q+ 3q2+ ... Hitqii+ ...) 
Pour calculer la série se trouvant entre parenthèses on multiplie par q la série 


14-29 3q2+ Qi . 
On obtient : 
g+2g2+3p +. +. =. 
La dérivation de cette série par rapport à g donne: 
4242294824... +rgiig. = 9 1e 


dq (1—q)} (1— 9} ° 
En multipliant par p = 1 — q on obtient: 


__1+39 
T9) 
La variance est donnée par la formule (5.7.18): 
1+9 1 q 


D PÉSTE A GP 
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d’où 


Exemple 4. La variable aléatoire continue X suit une loi de réparti- 
tion de densité 


f (zx) = Ae7l7l 
(fig. 5.7.3). 


Trouver le coefficient 4. Déterminer l'espérance mathématique, la varian- 
ce. les coefficients d'asymétrie et d’aplatissement de la répartition de X. 


f(x) 


0 
Fig. 5.7.3 


Solution. Pour trouver 4 on utilise la propriété suivante de la densité 
de probabilite : 


À Fès Î ex dr =24—1 ; 


d'où 
° A=1/2. 
La fonction ze-!*| étant impaire, l'espérance mathématique de X est nulle: 
(- 
Mx = | L re 1 dr —0. 
—o 
La variance et l'écart quadratique moyen sont respectivement : 
o0 


D, = [sex dr; 
0 
Ox = VD, = V2. 
La répartition étant "symétrique on a Sk — N. 
Pour calculer le coefficient d'aplatissement il y a lieu de trouver l;: 


©œ 
by = 2 j + rex dz = 
0 
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En pu 
Ez = ” 3—3. 


Exemple 5. La variable aléatoire X est répartie suivant une loi dont 
la densité est donnée paient sur la figure 5.7.4. 

Ecrire l'expression de la densité de probabilité. Trouver l'espérance mathé- 
matique. la variance, l'écart quadratique moyen et l'aplatissement de la répar- 
tition en question. 


f(x) 
Z 
0 / 
Fig. 5.7.4 
Solution. L'expression de la densité de probabilité est: 
0  & 
AO Pen 


0 pour zx < 0 ou z > 1. 
En utilisant la propriété de la densité de probabilité d’une répartition on 
trouve a = 2. 
L'espérance mathématique de X est: 
1 


Me = 222 dr 2. 
3 
La variance peut s'exprimer en fonction du moment initial deux: 
1 
Œ> = 2 Sir D. =a ne 
2° D 18 ? 
d'où 
1 


Le moment initial trois est égal à 
1 


&3—2 ztdx——. 
G 


En utilisant la troisième des formules (5.7.10) donnant pu, en fonction des 
moments initiaux, on a: ; 


Us = as — 3mças + 2mi = — 1% 
d'où 


7—2823 
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5.8. Loi de densité uniforme 


Dans certains problèmes on rencontre des variables aléatoires 
continues que l’on sait d avance se trouver dans les limites d’un 
certain intervalle; de plus on sait que, dans cet intervalle, toutes les 
valeurs de la variable étudiée sont équiprobables (plus exactement 
ont même densité de probabilité). On dit que ces variables aléatoires 

sont réparties suivant la Loi de den- 
4 silé uniforme. 
Voici quelques exemples de va- 
riables aléatoires de densité uniforme. 
Exemple 1. On pèse un corps 
à l’aide d'une balance de précision, 
mais on ne dispose que de poids mul- 
tiples d’un gramme; les résultats des 
pesées montrent que le poids du corps 
Fig. 5.8.1 se trouve entre k et À + 1 grammes. 
On adopte que ce poids est égal à 
(k + 1/2) grammes. L'erreur commise À est de toute évidence une 
variable aléatoire, répartie avec une densité uniforme sur l’inter- 
valle (—1/2, 1/2) g. 

Exemple 2. On fait tourner une roue verticale (fig. 5.8.1), 
puis cette roue s'arrête par frottement. Considérons la variable 
aléatoire 6, l'angle que fait après l'arrêt un rayon donné OA avec 
l'horizontale. 11 est évident que la variable 6 est répartie avec une 
densité uniforme sur l'intervalle (0, 2x). 

Exemple 3. Les rames de métro se suivent avec des inter- 
valles de 2 minutes. Les voyageurs arrivent sur le quai à des instants 
aléatoires. Le temps 7 que doit attendre un voyageur est une variable 
aléatoire, répartie avec une densité uniforme sur l'intervalle (0, 2) 
minutes. 

Considérons une variable aléatoire X suivant une loi de densité 
uniforme sur l'intervalle (æœ, B) (fig. 5.8.2) et écrivons l'expression 
de la densité de probabilité f (x). Cette fonction est constante et 
égale à c sur l'intervalle (œ, B); à l'extérieur de cet intervalle elle 
est nulle: 

c pou az hf, 


1 @ = {0 pour x<aœ ou x > $. 


L'aire comprise entre la courbe f (x) et l'axe des abscisses étant 
égale à l'unité: 
C (B _— a) —— 1, 


on en tire: 
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et la densité de probabilité f (x) est donc: 


j@)=r pour a<z<B, | 


f(z)=0 pour <a ou z>f. 


(5.8.1) 


La formule (5.8.1) est celle de la loi de densité uniforme sur 
l'intervalle (œ, B). 


fx) 


TZ 


FE: 
Fig. 5.8.2 Fig. 5.8.3 


Ecrivons l'expression de la fonction de répartition F (x). La fonc- 
tion de répartition est donnée par l'aire comprise entre la courbe f (x) 
et l’axe des abscisses se trouvant à gauche du point x. Par consé- 
quent : 


0 pour <a, 


TZ—@4 


—a Pour a z<B, 


F(x) = 
1 pour x > f. 


Le graphique de la fonction F (x) est donné sur la figure 5.8.3. 
Déterminons certaines des caractéristiques numériques de la 
variable aléatoire À suivant la loi de répartition uniforme sur l'in- 
tervalle (x, B). | 
L'espérance mathématique de X s'exprime: 


mes | gp dr=ih. (5.8.2) 


[+ 2 
Par suite de la symétrie de la loi uniforme, la médiane de X est 
aussi égale à 28 - 
La loi uniforme n'a pas de mode. 
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La variance de X est donnée par la formule (5.7.16): 


B 
Depp |(z-SHÉ) a, (5.8.3 


d'où l'écart quadratique moyen 


9. =VD.=— Te 


Comme la loi uniforme est symétrique, son coefficient d'asymé- 
trie est nul: 


(5.8.4) 


Sk=# 0. (5.8.5) 


Pour trouver le coefficient d'aplatissement il y a lieu de calculer 
préalablement le moment central quatre: 


TE Le 


B—« 
œ 
d'où 
Ez=$—3— 12: (5.8.6) 
L'écart arithmétique moyen est: 
8 
1 a +8 L a+$ P—a 
ep je less À ( PRE 
Ps 


(5.8.7) 


Enfin, calculons la probabilité pour la variable aléatoire X 
répartie suivant la loi uniforme sur l'intervalle (x, f) de tomber dans 


f(2) 


0 «a «a ô Ê L 
Fig. 5.8.4 


l'intervalle (a, b) appartenant à (œ, B) (fig. 5.8.4). Du point de vue 
géométrique cette probabilité est donnée par l'aire hachurée sur 
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la figure 5.8.4. Il est évident que 
P(a<X<b)=2—" (5.8.8) 


Fa 

c'est-à-dire que cette probabilité est égale au rapport de la longueur 
de l'intervalle (a, b) à toute la longueur de l'intervalle (œ, B) sur 
lequel la répartition uniforme est donnée. 


5.9. Loi de Poisson 


Dans les applications pratiques on rencontre des variables aléa- 
toires réparties suivant une loi particulière, dite loi de Poisson. 

Considérons la variable aléatoire discrète X pouvant prendre 
seulement des valeurs entières non négatives: 


0,1, 2, :.., m, .. 


la suite de ces valeurs n'ayant pas de limite théorique. 

On dit que la variable aléatoire X est répartie suivant la loi 
de Poisson si la probabilité qu'elle prenne la valeur m est donnée 
par la formule: 


Pr=—e" (m—=0,1,...) (5.9.1) 


où a est une certaine grandeur positive appelée paramètre de la loi 
de Poisson. 


Le tableau de répartition de la variable aléatoire X dans le cas 
de la loi de Poisson est: 


Zm | 0 | | | 2 lou) m lise 
Pn |e-* a gra 


an a 
€ 
2! 


11° 


m\ 


Nous allons tout d’abord vérifier que la suite des probabilités 
donnée par la formule (5.9.1) peut être une loi de répartition, c’est-à- 


dire que la somme de toutes les probabilités P,, est égale à l'unité. 
On a 


œo 00 © 
NW AT a _ a am 
PE 2ioue 2er 
m=-0 m:-10 m=0 
Mais 
© 
am 
> mi = €", 
m=—0 
d'où 
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Sur la figure 5.9.1 on peut voir les polygones de répartition de 
la loi de Poisson pour différentes valeurs du paramètre a. Dans la 
table 8 de l’annexe sont rassemblées les valeurs de P,, pour diffé- 
rentes valeurs de a. 


Fig. 5.9.1 


Trouvons maintenant les caractéristiques essentielles, à savoir 
l'espérance mathématiqüe et la variance de la loi de Poisson. Par 
définition de l'espérance mathématique on a: 


Mzx = M [X] = >. MPm = » m es. 
m=0 m=0 


Le premier terme de la somme (correspondant à m — 0) est 
égal à zéro, par conséquent on peut commencer la sommation par 
m = 1: 


œ œ 
am -a sa mam-i sà am-1 
— = (, À — € e 
Mx LS Der è (m—1)1 
Mz= 1 M1 Mami 


En introduisant la désignation m — 1 = k, on a: 


mx =ae" ÿ ae "e = a. (5.9.2) 


Ainsi le paramètre a n'est rien d'autre que l'espérance mathé- 
matique de À. 
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Pour déterminer la variance il y a lieu de trouver préalablement 
le moment initial deux de X: 


_ m _ m-1 
= D mere t=e Dma—pie = 
M0 M= 
: m-]1 
=eDlm-1+ln pie" 
= am-1 à am-1 E” 
[3eme + 2 meme] 


Nous avons montré plus haut que: 


= am-1 a aù a ; 
2 (mur = 2 ke =€, 


de plus: 
L am, aa 
>, {m=11° = 6 € 1; 
m=1 
par conséquent: 
a> = a(a +) 


et la variance de X: 
| D,=a—mX;—=a+a—at=a. (5.9.3) 


Ainsi, la variance d’une variable aléatoire suivant la loi de 
Poisson est égale à son espérance mathématique a. 

Cette propriété de la loi de Poisson est souvent utilisée dans les 
applications pratiques quand il y a lieu d'établir la vraisemblance 
de l'hypothèse suivant laquelle la variable aléatoire X suit la loi 
de Poisson. A cet effet on détermine à partir des données expéri- 
mentales l'espérance mathématique et la variance statistiques de 
X *). La proximité de leurs valeurs peut témoigner en faveur de 
la loi de Poisson; si ces caractéristiques sont nettement différentes 
l'hypothèse n'est pas confirmée. 

Déterminons pour une variable aléatoire X répartie suivant la 
loi de Poisson la probabilité pour que sa valeur ne soit pas infé- 
rieure à k. Soit R, cette probabilité: 


R, = P(X > k). 


*) Pour les méthodes expérimentales de détermination de ces caractéristi 
ques voir chapitres 7 et 14. 
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Il est clair que la probabilité R, peut être calculée comme la somme : 


Ra = Pr + Phys }- ss —= 2 Pm- 
Il est cependant plus simple de la trouver à partir de la probabi- 
lité de l’événement contraire: 
k—1 
Ra=1—(Po+ Pi... + Pys)=1— D Pm. (5.9.4) 
m=0 
En particulier, la probabilité pour que X soit positive est donnée 
par la formule: 


R,=1—Py—=1—e. (5.9.5) 


Nous avons déjà mentionné que dans de nombreuses applications 
on rencontre la loi de Poisson. Nous allons étudier un problème 
de ce genre. 


00 0— tete 


l 
Fig. 5.9.2 


Imaginons des points disposés au hasard sur l'axe des abscisses 
(fig. 5.9.2). Supposons que la répartition des points satisfasse aux 
conditions suivantes: 

1. La probabilité pour un intervalle Z de contenir un nombre 
quelconque de points dépend seulement de la longueur de cet inter- 
valle, mais non de sa position sur l’axe des abscisses. En d'autres 
termes, les points sont répartis sur l'axe des abscisses avec la mêmo 
densité moyenne que nous notons À (c'est l’espérance mathématique 
du nombre de points par unité de longueur). 

2. Les points sont répartis sur l’axe des abscisses indépendam- 
ment les uns des autres, c’est-à-dire que la probabilité pour qu'un 
nombre quelconque de points se trouve dans un intervalle donné 
ne dépend pas du nombre de points tomhés dans tout autre intervalle 
ne se recouvrant pas avec l'intervalle considéré. 

3. La probabilité pour que deux points ou plus tombent dans 
un petit intervalle Az est négligeable par rapport à la probabilité 
d’y trouver un seul point (cette condition signifie que deux points 
ou plus ne peuvent pratiquement pas coïincider). 

Séparons sur l’axe des abscisses un certain intervalle de longueur / 
et considérons la variable aléatoire discrète X associée au nombre de 
points se trouvant dans cet intervalle. Les valeurs possibles de cette 


variable sont 
0,1, 2,...,m,... (5.9.6) 
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Les points tombant dans l'intervalle indépendamment les uns 
des autres, il n’est théoriquement pas exclu que leur nombre soit 
infiniment grand, c'est-à-dire que la suite (5.9.6) soit sans fin. 

Montrons que X «uit la loi de Poisson. A cet effet calculons la 
probabilité P,, pour que dans l'intervalle Z il y ait exactement m 
points. 

Commençons par résoudre un problème plus simple. Considérons 
sur l'axe Ox un petit intervalle Az et calculons la probabilité d'y 
trouver au moins un point. Nous allons raisonner comme suit. 
L’espérance mathématique du nombre de points se trouvant dans 
cet intervalle est de toute évidence égale à À Az (car par unité de 
longueur il y a en moyenne À points). En vertu de la condition 3 
pour le petit intervalle Az on peut négliger la probabilité d'y trouver 
plus d’un point. Ainsi, l'espérance mathématique ÀAz du nombre 
de points se trouvant dans l'intervalle Az sera approximativement 
égale à la probabilité pour qu’un point (au moins un point) s'y 
trouve. 

Ainsi, à des infiniment petits d'ordre supérieur près, pour Az —+ 0 
on peut considérer que la probabilité pour que, dans l’intervalle Az, 
on ait un (au moins un) point est égale à A Az, et la probabilité pour 
qu'aucun point ne s’y trouve est égale à 1 — ÀAz. 

C'est ce que nous allons utiliser pour calculer la probabilité P,, 
pour que m points tombent dans l'intervalle L. Divisons |” intervalle / 


en r parties égales de longueur Az — £ . Nous dirons que l'inter- 


valle élémentaire Az est « vide» s'il de contient aucun point et 
qu ‘il est « occupé » s’il en contient au moins un. Conformément à ce 
qui a été démontré ci-dessus, la probabilité pour que l'intervalle Az 


soit « occupé » est approximativement égale à ré = = ; : la proba- 


bilité pour qu'il soit « vide » est égale à 1 — —. Comme en vertu 


de la condition 2 les points sont répartis indépendamment parmi les 
intervalles disjoints, on peut considérer nos n intervalles élémentai- 
res comme x expériences indépendantes, dans chacune desquelles 
; x À me Al 
un intervalle peut être « occupé» avec une probabilité p = —. 
Cherchons la probabilité pour que, des r» intervalles, soient occupés 


exactement m. En vertu du théorème des expériences FÉPELÉES cette 


probabilité vaut: 
œ (A) (A) 


ou, en introduisant la désignation À! = a: 


Cr (2) (1 +) | (5.9.7) 
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Pour n suffisamment grand cette probabilité est approximative- 
ment égale à la probabilité pour que exactement m points se trouvent 
dans l'intervalle !, car la probabilité de trouver dans l'intervalle Az 
plus d’un point est négligeable. Pour calculer la valeur exacte de 
Ph il faut passer dans l'expression (5.9.7) à la limite pour n —+ : 

À aim a\n-m 
m= lim Cr (2) (1-2). (5.9.8) 


n—+00 


Faisons la transformation: 


CS ms 
—_— 


Cr (2)" (1 _— ...(n—m+1) am (+) 


_n(n—1)...(n—m+1) am Su à 
ul Feat ‘ 
n 


La première fraction et le dénominateur de la dernière fraction 
dans l'expression (5.9.9) tendent vers l’unité pour r —> oo. L'expres- 
e am Cd Cd ° La 
sion -; ne dépend pas de n. Le numérateur de la dernière fraction 

peut s'écrire: 


(5.9.9) 


n 


(1—<)"=[(12)T (5.9.10) 


Pour n—+ 0 ——>0 et l'expression (5.9.10) tend vers e-°. 


Nous avons démontré ainsi que la probabilite pour que exacte- 
ment m points tombent dans l'intervalle / est donnee par l'expres- 
SIOn : 


am Lo 
En po 


où a = À, c'est-à-dire que la variable X suit une loi de Poisson 
de paramètre a = Al. 

Remarquons que la signification de a est le nombre moyen de 
points tombant dans l'intervalle de longueur |. 

La grandeur R, (probabilité pour que X soit positive) exprime 
la probabilité de trouver dans l'intervalle L au moins un point: 


R,—=1—e". (5.9.11) 


On voit ainsi que la répartition de Poisson apparaît là où des 
points (ou d’autres éléments) quelconques occupent au hasard une 
certaine position, indépendamment les uns des autres, et que l'on 
<ompte le nombre de points tombés dans une certaine région. Dans 
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notre cas cette région est l'intervalle / de l'axe des abscisses. On peut 
généraliser facilement la démonstration au cas de la répartition 
des points dans le plan (champ aléatoire plan) et dans l'espace 
(champ aléatoire spatial). Il est facile de montrer que pour les 
conditions suivantes : 

1) les points sont statistiquement uniformément répartis dans 
le champ avec une densité moyenne À; 

2) dans les régions disjointes les points tombent indépendamment 
les uns des autres: 

3) les points apparaissent un à un et non par couples, triplets, 
etc., le nombre de points X tombés dans une région quelconque D 
(plane ou spatiale) suit une loi de Poisson 


Pn=—e"* (m=0, 1, 2, ss.) 


où a est le nombre moyen de points tombés dans la région D. 
Dans le cas d'un plan on a: 


a — Sp‘À; 


où SL est l'aire de la région D; 
pour le cas spatial: 


a — Vh À, 


où V, est le volume de la région D. 

Notons que la condition 1) de densité constante importe peu 
pour que le nombre de points tombés dans une région quelconque 
suive une loi de Poisson, si seulement les deux autres conditions 
sont remplies; dans ce cas le paramètre a s'obtient différemment. 
Pour l'obtenir il faut, au lieu de multiplier la densité À par la 
longueur, l'aire ou le volume de la région, intégrer la densité varia- 
ble sur l'intervalle, l'aire ou le volume (pour plus de détails voir 
$ 19.4). 

La dispersion aléatoire de points sur une droite, dans un plan 
ou dans un volume n’est pas le cas unique où la loi de Poisson peut 
se manifester. On peut montrer, par exemple, que la loi de Poisson 
est la loi limite pour la répartition binomiale 


Pmin=CRp"(1— p}"", (5.9.12) 


si on fait simultanément tendre le nombre d'expériences »r vers 
l'infini et la probabilité p vers zéro, leur produit ayant une valeur 
constante 


np = a. (5.9.13) 
En effet, exprimons cette tendance de la loi binomiale: 


lim Cap" (1— pi" = = CS (5.9.14) 
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mais en vertu de la condition (5.9.13) 


P ——— = : (5.9.15) 
alors en substituant (5.9.15) dans (5.9.14) nous obtenons l'égalité. 
lim C® (2) (1 es (5.9.16) 


D] 


que nous venons de démontrer à une autre fin. 

Cette propriété limite de la loi binomiale est souvent utilisée 
dans les applications pratiques. Supposons qu'on effectue un grand 
nombre d'expériences indépendantes nr dans checune desquelles 
l'événement À a une probabilité infime p d'être réalisé. Pour cal- 
culer la probabilité P,,., de réalisation de l'événement À exacte- 
ment m fois on peut se servir de la formule approchée 


Pmn & CPP e-"7, (5.9.17) 


où np = a est le paramètre de la loi de Poisson remplaçant approxi- 
mativement la répartition binomiale. 

C'est à cause de cette propriété de la loi de Poisson d'exprimer la 
répartition binomiale pour un grand nombre d'expériences et une 
probabilité infime de l'événement qu'elle est parfois appelée Loi 
des événements rares. 

Considérons quelques exemples où l’on rencontre la répartition 
de Poisson. 


Exemple 1. Une centrale téléphonique recoit des appels à raison de K 
appels par heure en moyenne. Supposant que Je nombre d'appels pendant un 
intervalle de temps quelconque suit une loi de Poisson, trouver la probabilité 
pour que durant deux minutes la centrale reçoive exactement trois appels. 

Solution. Le nombre moyen d'appels en deux minutes est: 

or 
7 60 4° 
La formule (5.9.1) donne la probabilité de trois appels: 


(4 
3u 
12 
Exemple 2. Dans les conditions de l'exemple précédent trouver la 


probabilité pour qu’en deux minutes la centrale reçoive au moins un appel. 
Solution. La formule (5.9.4) donne: 


P3= 


Ri=i—e-a=1—e K/30, 


Exemple 3. Dans les mêmes conditions trouver la probabilité pour- 
qu’en deux minutes Ja centrale reçoive au moins trois appels. 
Solution. La formule (5.9.4) donne: 


Ra=1— (lo Pa+Pa)=1— 07/80 x [1 ++ (5) ]: 
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Exem P le 4. Le fil d'un métier à tisser se casse en moyenne 0,375 fois 
ar heure de fonctionnement du métier. Trouver la probabilité pour que durant 
uit heures de travail le nombre X de cassures du fil se trouve entre 2 et 4 

2<XS<S 4). | 

Solution. Il est évident que l’on a: 


a = 0,375.8 = 3, 


P2SXS4)= P2 + Ps + Pi. 
La table 8 de l’annexe donne pour a = 3: 
P: = 0,224; P,; = 0,224; P, = 0,168, 
P(2<SXS 4) = 0.616. 
Exemple 5. Une cathode chaude émet par unité de temps en moyenne 
g (0) électrons. où f est le temps écoulé à partir du début de l'expérience. Trouver 


probabilité que durant un temps t commençant à l'instant #, la cathode 
émettra exactement m électrons. 


Solution. Cherchons le nombre d'électrons a émis par la cathode durant 
le temps t. On a: 


alors: 


to+t 
a — | g(t) dt. 
lo 
Connaissant «, calculons la probabilité cherchée: 


Pu— es 
= — $ " 
Nm 


Exemple 6. Des pièces sont découpées dans une feuille de métal ayant 
des défauts ponctuels. Les défauts forment un champ satisfaisant aux condi- 
tions 1). 2). 3) de la page 107. de densité 0,03 point par cm?. Si dans une pièce 
il y a au moins un défaut ponctuel, la pièce est rejetée. La surface de la pièce 
S = 10 cm?. Trouver la probabilité pour une pièce d'être rejetée. 

Solution. Onaa—ÀS = 0,03-10 = 0,3. La formule (5.9.5) donne 
la er ts pour que dans les limites d’une pièce il y ait au moins un défaut 
ponctuel : 


Ri=1—0"0,3—1— 0,741 —0,259. 


Exemple 7. La densité moyenne des microbes nocifs dans un mètre 
cube d'air est égale à 100. On prend un échantillon de 2 dm* d'air. Trouver la 
probabilité pour que dans ce volume il y ait au moins un microbe. 

Solution. Supposant que le nombre de microbes contenus dans un 
volume suive une loi de Poisson on a: 


a=0,2; Ri=1—e0,2& 1— 0,819 & 0,18. 

Exemple 8. Un dispositif technique se compose de n — 50 éléments 
pouvant chacun, durant le temps de fonctionnement t, tomber en panne (les 
uns indépendamment des autres) avec une probabilité égale à 0,04. En se basant 
sur la propriété limite de la répartition binomiale (formule (5.9.17)) trouver la 
probabilité pour que durant le temps t aucun élément ne soit en panne, ou qu'un, 
deux... éléments soient en panne. 

Solution. Onaa=— np = 50-0,04 = 2. La table 8 de l’annexe donne 
pour a = 2: 

Po= 0,135; P, 20,271; P,: =0,271; P, = 0,180; 
P;:, = 0,090; Ps = 0,036: P,= 0,012; P3 = 0,004: 
Pa = 0,001; Po = Pin = ... =. 


CHAPITRE 6 


LOI NORMALE 


6.1. La loi normale et ses paramètres 


La loi de répartition normale (souvent appelée loi de Gauss) 
joue un rôle particulièrement important dans la théorie des probabi- 
lités et dans les applications pratiques en occupant une place de 
choix parmi les lois de répartition. La particularité fondamentale 
de la loi normale la distinguant des autres lois est que c'est une 
loi limite vers laquelle tendent les autres lois pour des conditions 
se rencontrant fréquemment dans les applications pratiques. 

On peut montrer que la somme d'un nombre suffisamment grand 
de variables aléatoires indépendantes (ou faiblement liées) suivant 
des lois quelconques, pour des restrictions assez faibles, tend appro- 
ximativement vers une loi normale et ceci avec d'autant plus de 
précision que le nombre de termes est important. La majorité des 
variables aléatoires que l’on rencontre dans la pratique, comme par 
exemple les erreurs de mesure, les erreurs de tir, etc. peuvent être 
considérées comme des sommes d’un nombre relativement important 
de termes, erreurs élémentaires, dues chacune à une cause différente 
indépendante des autres. Quelle que soit la loi des erreurs élémen- 
taires, les particularités de ces répartitions n'apparaissent pas dans 
la somme d'un grand nombre de celles-ci, la somme suivant une 
loi voisine de la loi normale. La seule limitation imposée aux erreurs 
sommées est de jouer dans la somme un rôle relativement peu impor- 
tant. Si cette condition ne se trouve pas remplie et que par exemple 
l'une des erreurs aléatoires prévaut nettement sur les autres, celle-ci 
détermine en gros traits la loi de répartition de la somme. 

Les théorèmes établissant que la loi normale est la loi limite 
d’une somme de termes aléatoires indépendants uniformément petits 
seront étudiés dans le chapitre 13. 

La loi normale est caractérisée par la densité de probabilité 
de la forme: 

(x—m)3 

Le 2, 
o V2x 

La courbe de la densité de la loi normale a la forme d’une cloche 
symétrique (fig. 6.1.1). L'ordonnée maximale de la courbe, égale 


f(z)= 


(6.1.1) 
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à VE , correspond au point z = m; au fur et à mesure que l’on 
s'éloigne du point m la densité de probabilité diminue et pour 
z—> oo elle tend asymptotiquement vers l'axe des abscisses. 

Donnons une interprétation aux paramètres "= et © entrant dans 
l'expression de la loi normale (6.1.1). Nous allons démontrer que 
m n'est rien d'autre que l'espérance 
mathématique, et o, l'écart quadra- 
tique moyen de À. À cet effet nous 
calculons les caractéristiques numé- 
riques essentielles de X, c’est-à-dire 
son espérance mathématique et sa 
variance : 


M [X] — | xf (x) dr = 


H 


Q 
à 


— 


© 
Ÿ 
ñ 


_(x-m)3 


œ 
= | ze 207 ÿz. Fig. 6.1.1 
— co 


o V2x 


En introduisant le changement de variable 


TI— mm 7 


oV2 


on obtient: 


O0 


M = | (o V2t+ m)e-"° dt — 
I 


= oe | Le dt + | e-!* dt. (6.1.2) 
PL 


Il est facile de voir que la première des deux intégrales dans (6.1.2 
est nulle; la seconde est l'intégrale d’Euler-Poisson : | 


| e-"a=2 | e-“dt=Vx. (6.1.3) 
pe 0 
Par conséquent : 
MIX) = m, 


c'est-à-dire que le paramètre m est l'espérance mathématique de la 
variable X. On appelle souvent ce paramètre, surtout dans les pro- 
blèmes de tir, centre de dispersion. 
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Calculons la variance de X: 


2 (x—m)? 


: 1 EEE 
DIX] = —— — m} 207 : 
Ne fe my? e dx 
En changeant de nouveau de variable: 
Z—m 
=> =t, 
oV'rn 


On a: 
DIX] 7 il le" dt. 


L'intégration par parties donne: 


DXI= | t-2te-t* dt = 7 { —e-" 


[CH. 6 


7 + L et? dt} | 


Le premier terme dans l’accolade est égal à zéro (car pour { —+ co 
et décroît plus rapidement que ne croît aucune puissance de #), 


f(à) 
Y\X 
0 M; M2 Ty 


Fig. 6.1.2 


le second terme dans la formule (6.1.3) est égal à V1, d'où: 


D {X] = ot. 


Par conséquent le paramètre © dans la formule (6.1.1) n est rien 


d’autre que l'écart quadratique moyen de la variable X. 


Arrêtons-nous sur la signification physique des paramètres m 
et o. La formule (6.1.1) montre que le centre de dispersion m est 
le centre de symétrie de la répartition. En effet lorsque la différence 
(x — m) change de signe, l'expression (6.1.1) reste inchangée. Si m 
change de valeur, la courbe de densité se déplace suivant l'axe des 
abscisses sans changer de forme (fig. 6.1.2). Le centre de dispersion 
caractérise la position de la répartition sur l'axe des abscisses. 

La dimension du centre de dispersion est celle de la variable 


aléatoire À. 
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Le paramètre © caractérise non pas la position mais la forme de 
la courbe de densité, c’est une caractéristique de la dispersion. 
L'ordonnée maximale de la courbe de répartition est inversement 
proportionnelle à © ; lorsque © augmente l’ordonnée maximale dimi- 
nue. L'’aire limitée par la courbe de densité devant toujours être 
égale à l’unité, avec augmentation de © la courbe devient plus plate 
et s'étale en abscisses; au contraire lorsque © diminue, la courbe 
s’allonge vers le haut en se rétrécissant des côtés, devenant de plus 
en plus pointue. Sur la figure 6.1.3 on peut voir trois courbes de lois 


f(x) 
[II 


0 
Fig. 6.1.3 


normales (7, II, III) pour m = 0; o&, > 62 > o3. Le changement 
du paramètre o équivaut à une augmentation de l'échelle suivant 
l’un des axes et à une même diminution suivant l’autre axe. 

Il est évident que le paramètre o a même dimension que la variable 
aléatoire À. 

Dans certains cours de théorie des probabilités pour caracté- 
riser la dispersion de la loi normale on utilise non pas l'écart quadra- 
tique moyen mais une grandeur qui lui est inversement proportionnel- 
le, appelée mesure de précision et définie par 


1 
oV2 


R= 


La dimension dela mesure de précision est l’inverse de celle de X. 

Le terme « mesure de précision » a été emprunté à la théorie 
des erreurs. En utilisant la mesure de précision À on peut écrire 
comme suit la loi normale: 


Î (x) — 4 e—hx-m)i, 


114 LOI NORMALE (CH. 6 


6.2. Moments de la loi normale 


Nous avons montré ci-dessus que l'espérance mathématique d’une 
variable aléatoire suivant la loi normale (6.1.1) est égale à m, et 
l'écart quadratique moyen à 6. 

Nous allons obtenir les formules générales pour les moments 
centrés d'ordre quelconque. 

Par définition: 

œ (x-m)2 
= | (z—m)f(z)àr=- 


sie m)'e_ 2? dr. 


Après le changement de variable 


TI—m 


o V2 . 
on a: 
= | t'e-'* dt. (6.2.1) 


Intégrons l'expression (6.2.1) par parties, il vient: 


= Cyr f t°”"lte-t* dt = 
Le = 5 e—t2fs-1 nl Le fe re" dt}. 


Le premier terme dans l’accolade étant nul, on a: 


Us = (s— eneer fe t‘-2e-12 dt. (6.2.2) 


A partir de (6.2.1) on obtient pour u,_2 l'expression suivante: 
s-2 
pes EVE Ÿ areas 629 


En comparant les seconds membres des formules (6.2.2) et (6.2.3) 
on voit qu'ils ne diffèrent que par le facteur (s — 1) o?, par consé- 
quent : 

Us —=(s —1) ous 2. (6.2.4) 


La formule (6.2.4) est une formule de récurrence permettant 
d'exprimer les moments d'ordre supérieur en fonction des moments 
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d'ordre inférieur. Compte tenu de po = 1 *) et y = 0, cette formule 
permet de calculer les moments centrés d'ordre quelconque. Comme 
1 = 0, il est immédiat que tous les moments impairs de la loi 
normale sont nuls. Ceci découle d’ailleurs de la symétrie de la loi 
normalc. 
La formule (6.2.4) pour s pair donne les expressions suivantes 

pour les moments: 

D = 0? : 

Ma == 30* ; 

us = 190°, etc, 


La formule générale donnant le moment d'ordre s pour s pair 
quelconque est: 
us =(s—1)!!0", 


où le symbole (s — 1)!! désigne le produit de tous les nombres 
impairs de À à s — 1. 

Comme pour la loi normale on a pu; = 0, l’asymétrie est égale- 
ment nulle: 


L'expression du moment quatre: 
Ma — 30! 
permet de trouver: 
Er=1t—3=0, 


autrement dit, l'aplatissement de la loi normale est nul. C’est tout 
naturel car le coefficient d'aplatissemént caractérise justement la 
pente d'une loi de répartition quelconque par rapport à la loi nor- 
male. 


6.3. Probabilité pour une variable aléatoire 
normale de tomber dans un intervalle donné. 
Fonction de répartition normale 


Dans de nombreux problèmes traitant des variables aléatoires 
normales souvent il y a lieu de trouver la probabilité pour une 
variable aléatoire X, répartie suivant une loi normale de paramè- 
tres m, o, de tomber dans l'intervalle &, B. Pour calculer cette pro- 
babilité nous allons utiliser la formule générale: 


P(æ<X<$)=F(B) —F (a), (6.3.1) 
où F' (x) est la fonction de répartition de X. 


*) Le moment d'ordre zéro de toute variable aléatoire est égal à l'unité 
en tant qu'espérance mathématique de la puissance zéro de cette variable. 


8° 
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Nous allons trouver la fonction de répartition F (x) de la variable 
aléatoire X répartie suivant une loi normale de paramètres m, o. 
La densité de probabilité de X est: 


(x—m)3 
—_1_,7 zx, 
f(x) Va e (6.3.2) 
d'où la fonction de répartition: 
X n < = (x— m})? 
= = ms 207 D. 
F(x) J re VE EL dz. (6.3.3) 
Introduisons dans l'intégrale (6.3.3) le changement de variable: 
z—m 
=t, 
0 
on obtient alors: 
y ft -i 
FES ÿ e ‘dl. (6.3.4) 


L'intégrale (6.3.4) ne peut s'exprimer par des fonctions élémen- 
taires mais elle peut être calculée à l’aide d’une fonction spéciale 
12 


qui est une intégrale définie de e-‘? ou dee 2? (appelée intégrale des 
probabilités) laquelle est tabulée. Il existe un certain nombre de 
fonctions de ce genre, par exemple: 


Parmi les fonctions de cette espèce nous choisirons 
1 ff -$ 
D'(r)=—— |e ? dt. 3. 
D=> fe dt (6.3.5) 


Il est facile de voir que cette expression n'est rien d'autre que 
la loi de répartition normale de paramètres m = 0, © = À. 

Convenons d'appeler la fonction ®® (x) fonction de répartition 
normale. On peut trouver dans l'annexe (table 1) les valeurs tabulées 
de la fonction ®* (zx) *). 


*) Pour faciliter l’interpolation, dans les tables, à côté des valeurs de la 
fonction on donne son accroissement pour un pas 
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Exprimons la fonction de répartition (6.3.3) à l’aide de la fonc- 
tion de répartition normale ®* (x). Il est évident que 


F(x)=@* (=) (6.3.6) 


Nous pouvons maintenant trouver la probabilité pour la variable 
aléatoire X d'atteindre l’intervalle compris entre & et B. En vertu 
de la formule (6.3.1) on a: 


P(a<X<p=® (=) -@ (2). (6.37) 


Nous avons exprimé la probabilité pour la variable aléatoire X 
répartie suivant une loi normale de paramètres quelconques de 
tomber dans l'intervalle donné, à l’aide de la fonction de répartition 
normale O* (x) correspondant à la loi normale simple de paramètres 0 
et 1. Notons que les arguments de la fonction ©* dans la formule 
(6.3.7) ont une interprétation très simple. En effet, ti ot = 
sont les distances des extrémités droite et gauche respectivement 
jusqu’au centre de dispersion, exprimées en écarts quadratiques 
moyens. La distance est considérée positive si l'extrémité de l’inter- 
valle est à droite du centre de dispersion et négative si elle est 
à gauche. 

Comme toute fonction de répartition, la fonction O* (x) est 
douée des propriétés suivantes: 

14. O *(—oco) = 0. 

2. D* (+oo) = 1. 

3. O® (zx) est une fonction non décroissante. 

En effet, en vertu de la symétrie de la loi normale de paramètres 
m — 0, o — 1 par rapport à l'origine des coordonnées, on a: 


D (—z) = 1 — D (x). (6.3.8) 


En utilisant cette propriété on aurait pu se limiter dans les 
tables de la fonction O* (x) uniquement aux valeurs positives de 
l'argument, mais pour épargner une opération supplémentaire 
(retranchement de l'unité), dans la table 1 de l’annexe on donne les 
valeurs de ®* (x) tant pour les arguments positifs que négatifs. 

Dans les applications pratiques souvent il v a lieu de calculer 
la probabilité pour une variable normale d'atteindre le domaine 
symétrique par rapport au centre de dispersion m. Soit un tel domai- 
ne de longueur 2! (fig. 6.3.1), la formule (6.3.7) permet de calculer 
la probabilité d'atteindre ce domaine, soit: 


P(m—l<X<m+t)=@(+)-@(-+). (6.3.9) 


Vu la propriété (6.3.8) de la fonction ®* (x) et en simplifiant 
l'écriture de la formule (6.3.9), on obtient la formule donnant la 
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probabilité pour une variable aléatoire normale d'atteindre le 
domaine symétrique par rapport au centre de dispersion: 


P(IX—m|<1)=20 (+) —1. (6.3.10) 


Proposons nous de résoudre le problème suivant. A partir du 
centre de dispersion m on porte des segments successifs de longueur © 
(fig. 6.3.2) et on calcule la probabilité pour la variable aléatoire X 


f(x) f(2) 


0 m-U m mt oO € 0 
Fig. 6.3.1 Fig. 6.3.2 


d’atteindre chacun d'eux. La courbe de la loi normale étant symé- 
trique, il suffit de porter ces segments d’un seul côté. 
La formule (6.3.7) donne: 


P(m<X<m +o) = ®* (1) — D* (0) = 


= 0,8413 — 0,5000 & 0,341; | 
P(m + 0< X <m + 20) = @* (2) — ®* (1) & 0,136: | (63.14) 
P(m + 2a ZX Sm + 30) = De (5) — D? (2) æ 0.042 | 3. 
P ({m +-35<X<m + 40) = ®D* (4) — D* (3) = 0,001. 


Les résultats obtenus montrent que la probabilité de tomber dans 
chacun des segments suivants (cinquième, sixième, etc.) est égale 
a zéro à 0,001 près. 

En arrondissant les trois premiers chiffres à 0,01 (à 1 % près) 
on obtient trois nombres faciles à retenir: 


0,34; 0,14; 0,02. 


La somme de ces trois valeurs est égale à 0,5. Ceci signifie que 
pour la répartition normale d’une variable aléatoire toute la dis- 
persion (à des fractions de pour cent près) se limite à l'intervalle 
m + 30. 

Ceci permet, connaissant l’écart quadratique moyen et l'espé- 
rance mathématique d'une variable aléatoire, d'indiquer l'intervalle 
de ses valeurs possibles. Cette méthode d'estimation de la gamme des 
valeurs possibles d’une variable aléatoire s'appelle en mathématique 


6.3] PROBABILITÉ DE TOMBER DANS UN INTERVALLE DONNE 119 


statistique « loi des trois sigma ». La loi des trois sigma permet 
également de trouver la valeur approchée de l'écart quadratique 
moyen de la variable aléatoire: on prend l’écart maximal pratique- 
ment possible de la moyenne et on le divise par trois. Il est évident 
que cette méthode grossière ne peut être recommandée que s’il n°y 
a pas d’autres méthodes plus précises pour trouver 0. 


Exemple 1. Soit la variable aléatoire X normalement répartie et 
correspondant à l'erreur de mesure d’une certaine distance. Lors de la mesure 
on fait une erreur systématique par excès de 1,2 m; l'écart quadratique moyen 
de l'erreur de mesure est égal à 0,8 m. Trouver la probabilité pour que l'écart 
.. la valeur mesurée et la valeur réelle ne soit pas en valeur absolue supérieur 
à 1,6 m. 

Solution. L'erreur de mesure est une variable aléatoire X suivant une 
loi normale de paramètres m — 1,2 et o = 0,8. Il s'agit de trouver la probabilité 
pour cette variable de tomber dans l'intervalle & — —1,6 à f — +1,6. En vertu 
de la formule (6.3.7) on a: 

1,6—1,2 


P(—1,6<X <1,6)=0° ( = 
=©* (0,5) —O* (— 3,5). 
En utilisant les tables de la fonction ©@* (x) (annexe table 1) ou trouve: 
®D* (0,5) = 0,6915; ©®* (—3,5) = 0,0002. 


)—o- EE) 


0,8 


d'où: 
P (—1,6 << X << 1,6) — 0,6915 — 0,0002 = 0,6913 = 0,691. 
Exemple 2. Trouver la même probabilité que dans l’exemple précé- 


dent pour le cas où il n’y a pas d'erreur systématique. 
Solution. En vertu de la formule (6.3.10), posant ! = 1,6. on trouve: 


L 1,6 PA 
P(|X|<1,6)—20 1 2 0,955. 


Exemple 3. Une usine fabrique des billes de diamètre nominal 0.8 cm; 
les défauts d'usinage donnent une erreur de diamètre répartic suivant une loi 
normale, de moyenne nulle (il n’y a pas d'erreur systématique) et d'écart qua- 
dratique moyen © — 0,001 cm. Lors du contrôle sont mises à rebut toutes les 
billes qui passent dans une bague de diamètre 0,798 cm ainsi que les billes ne 
pouvant passer dans une bague de diamètre 0,802 cm. Trouver la probabilité 
pour qu’une bille prise au hasard soit rejetée. 

Solution. Soit D le diamètre de la bille. L'événement 4 suivant lequel 
une bille est rejetée se compose de deux événements: 


A = Ài + A2. 


où l'événement À, correspond au cas D << 0,798, ct l'événement 4: au cas 
D => 0,802. Calculons la probabilité de l'événement contraire À consistant 
en ce que la bille est acceptée, c'est-à-dire que le diamètre D se trouve entre 
0,798 et 0,802 cm: 
P (A) = P (0,798 < D < 0,802) = P (| D — my | < 0,002), 

où mg = 0,8 est le diamètre nominal de la bille. On a 

0,002 
0,001 


P(Â)=20%° ( —1—2T* {2) —1— 2.0,9772—1 & 0,954, 


d'où 
P (A) = 1 — 0,954 — 0,046. 
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Exemple 4. Soient une variable aléatoire X normalement répartie 
de centre de dispersion m (fig. 6.3.3), et un certain intervalle (&, f) de l'axe 
des abscisses. Quelle doit être la valeur 
de l'écart quadratique moyen © de la 
variable aléatoire X pour que la proba. 
bilité p d'atteindre l'intervalle (&. B) soit 
maximale? 

Solution. Ona: 


p=P(a<X <fB)= 


| 


ma den ne de à 


Fig. 6.3.3 Dérivons cette fonction de o: 


g=[o (5m) fo(s=m) 


mais 


En utilisant la règle de dérivation d'une intégrale par rapport à la varia- 
ble figurant dans sa limite. on obtient: 


Bp-m 
7e _#1 
on) Ÿ Fa 
__1. - EX _ B—m _ B—m En 
V2r oè }= o2 V2x 


? . 
D une manière analogue: 


| = (œ=me 
[o(2)] à 
( o o2 V2 
Pour trouver l’extremum on pose: 
__(œ-m)3 __(B-m)1 


pu 1 u 202 _ 9 203 
P O= = Va C m)e (B—m)e }: (6.3.12) 


Pour & = cette expression s’annule et la probabilité p devient maximale. 
Le maximum de p est donné par la condition: 


_ (a=mi _ B-m} 
(a—m)e 2% —(B—mje 2% —0. (6.3.13) 


On peut résoudre l’équation (6.3.13) soit numériquement, soit graphiquement. 
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6.4. Ecart probable 


Dans certaines applications de la théorie des probabilités (en 
particulier dans la théorie du tir) en plus de l’écart quadratique 
moyen on utilise encore une caractéristique de dispersion, à savoir 
l’écart probable, ou l’écart médian. L'écart probable est générale- 
ment désigné par la lettre E (parfois B). 

On appelle écart probable (médian) de la variable aléatoire X 
normale, la moitié de la longueur de l'intervalle symétrique par 
rapport au centre de dispersion tel que la probabilité d'y tomber soit 
égale à 1/2. 

Sur la figure 6.4.1 on a |”) 
donné l'interprétation géomé- 
trique de l'écart probable. 

L'écart probable E est la moi- 
tié de la longueur du segment 
de l'axe des abscisses, symé- 
trique par rapport au point m 
et servant de base à la figure 
d’aire égale à la moitié de 


l'aire dela courbe de réparti- _- ZT 
tion. E E 

Nous allons préciser la si- | 
gnification du terme « écart Fig. 6.4.1 


médian» ou «erreur médiane» 

qui est souvent utilisé dans l'artillerie au lieu de l'écart probable. 
Considérons une variable aléatoire À répartie suivant une loi 

normale. La probabilité pour qu'elle s’écarte du centre de dispersion 

m d’une valeur inférieure à £ est, par définition de l'écart probable, 

égale à 1/2: 


P(IX—m|< E)=+. (6.4.1) 


La probabilité pour qu’elle s’écarte de m de plus de Æ est égale- 
ment égale à 1/2: 


1 
P((X—m|>E)=+. 


Ainsi, lorsque le nombre d'expériences est important, environ la 
moitié des valeurs de X s'écartera de m de plus de Æ et la moitié 
de moins de Æ£. D'où le terme « erreur médiane », « écart médian ». 

Il est évident que l'écart probable en tant que caractéristique 
de la dispersion doit dépendre directement de l'écart quadratique 
moyen ©. Nous allons établir cette relation.A cet effet nous calculons 
la probabilité de l'événement | X — m | < E dans l’équation (6.4.1) 
à l'aide de la formule (6.3.10): 


P(IX—m|<E)= 20° (=)-1- 


W| 
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d'où 


D (2) = 50,75. (6.4.2) 


Les tables de la fonction O* (x) permettent de trouver la valeur 
de l'argument z telle que d* (z) = 0,75. On trouve approximative- 
ment zx — 0,674, donc: 


+ — 0,674; E—0,6740. (6.4.3) 


Ainsi, connaissant o on peut immédiatement trouver la valeur 
de Æ qui lui est proportionnelle. Souvent on écrit comme suit cette 
relation : 


E=pV20, (6.4.4) 


où p est la valeur de l’argument pour laquelle l’une des formes de 
l'intégrale de probabilité, appelée fonction de Laplace et donnée par 


2 
Vr 
est égale à 1/2. La valeur 
numérique de p est approxi- 
mativement égale à 0,477. 

A l'heure actuelle l'écart 
probable, en tant que caracté- 
ristique de la dispersion, cède 
la place à une caractéristique 
Ë plus universelle oc. Cependant 
2 


O (zx) = 


< 
| et? dt, 
0 


dans certains domaines d'ap- 
plication de la théorie des 
probabilités elle continue à 
s'employer par tradition. 

Si pour caractériser la dispersion on prend l'écart probable EF, 
la densité de probabilité de la répartition normale s’écrira: 


p2 
Es mm} 


Up 
f(x) — EV= e : (6.4.5) 
et la probabilité pour X de se trouver entre « et f prendra la forme: 


P@<x<p=r[b(Et) &(2t)], (6.46) 


E E 
où ox 
à : 2 _ 7 
(= fe dt (6.4.7) 


U 
est la fonction de Laplace réduite. 
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Faisons un calcul analogue à celui du paragraphe précédent pour 
l'écart quadratique moyen ©, c’est-à-dire, portons à partir du centre 
de dispersion m des segments successifs de longueur E (fig. 6.4.2) 
et calculons les probabilités d'atteindre ces segments à 0,01 près. 


On a: 

Pim<X<m+E)z 0,25; 
Pim+E<X<m+2E)z 0,16; 
P(m+2E<X<m+3E)z 0,07; 
P(m+3E<X<m+s4E)z 0,02. 


On remarque qu'avec une précision de 0,01 toutes les valeurs 
d'une variable aléatoire normale se trouvent dans l'intervalle 
m + 4£E. 


Exemple. Un avion a pour mission de larguer des colis sur une auto- 
route d’une largeur de 8 mètres. Le vol a lieu le long de l'autoroute, la visée 
suivant sa ligne moyenne; le glissement donne lieu à une erreur systématique 
de 2 m à droite dans la direction du vol. Les écarts probables principaux sont: 
dans la direction du vol B, = 15 m, latéralement B; — 5 m. Sans utiliser des 
tables de probabilités, ne connaissant que les nombres 


25 %, 16 %, 7 %, 2 %, 


estimer grossièrement la probabilité pour un colis de tomber sur l’autoroute 
et la probabilité pour au moins un colis des trois largués d'y tomber. 
Solution. Pour résoudre le problème il suffit de considérer une des 
coordonnées du point de chute, à savoir l’abscisse X dans une direction per- 
pendiculaire à l'autoroute. Cette abscisse est répartie suivant une loi normale 
de centre de dispersion m = 2 et d'écart probable B; — E — 5 m. Portons de 
part et d'autre du centre de dispersion un segment de 2 m correspondant à 0.4 
de l'écart probable. La probabilité d'atteindre ce segment est approximative- 


ment égale à 
0,4-25 % = 0,1. 


À gauche du centre de dispersion la cible s'étend à 6 m. Sur ces 6 m se pla- 
cent un écart probable entier (soit 5 m). auquel est associée la probabilité 25 % 
plus une partie (1 m) d'un autre écart probable, la probabilité associée à ce 
second écart étant 16 %. La probabilité d'atteindre le domaine de longueur 
1 m est approximativement le à: 


16% —= 0,03. 
Ainsi la probabilité de larguer le chargement sur l'autoroute est approxi- 


mativement égale à: 
0,1 + 0,25 + 0,03 = 0,38. 


La probabilité pour un colis au moins des trois largués de tomber sur 
l'autoroute est égale à: 


Ri—1—(1— 0,38) + 0,76. 


CHAPITRE 7 


DÉTERMINATION DES LOIS DE RÉPARTITION 
DES VARIABLES ALÉATOIRES À PARTIR 
DES DONNÉES EXPÉRIMENTALES 


7.1. Problèmes de base des mathématiques 
statistiques 


Les lois mathématiques de la théorie des probabilités ne sont 
pas une pure abstraction dénuée de sens physique mais l’expression 
mathématique des lois régissant en fait les phénomènes aléatoires 
de la nature se produisant de nombreuses fois. 

Jusqu'à présent, en parlant des lois de répartition des variables 
aléatoires nous n'avons pas touché à la question de l’origine et des 
fondements de ces lois. On peut répondre à cette question sans ambi- 
guité que ces lois sont établies expérimentalement; toute étude 
des phénomènes aléatoires par les méthodes de la théorie des proba- 
bilités est basée, directement ou indirectement, sur des données 
expérimentales. En introduisant les notions d'événement et de sa 
probabilité, de variable aléatoire, de loi de répartition et de caracté- 
ristiques numériques, la théorie des probabilités permet de déterminer 
théoriquement les probabilites des événements en fonction des 
probabilités d’autres événements, les lois de répartition et les carac- 
téristiques des variables aléatoires en fonction des lois de répartition 
et des caractéristiques numériques d'autres variables aléatoires. 
Ces méthodes indirectes permettent de gagner du temps et d’écono- 
miser sur les frais des expériences mais n'excluent pas celles-ci. 
Toute étude des phénomènes aléatoires, si abstraite soit-elle, a ses 
racines dans l'expérience et les observations. 

La statistique théorique a pour objet la recherche et la mise au 
point des méthodes d'enregistrement, de description et d’analvse des 
données statistiques expérimentales fournies par l'observation des 
séries de faits ou de phénomènes. 

Les problèmes de la statistique concernent toujours les séries de 
faits aléatoires, mais peuvent prendre différentes formes suivant 
le problème concret à résoudre et la quantité de données dont on dis- 
pose. 

Nous allons décrire brièvement certains problèmes typiques 
de la statistique que l’on rencontre couramment dans la pra- 
tique. 


7.1) PROBLÈMES DE BASE DES MATHÉMATIQUES STATISTIQUES 425 


1. Détermination de la loi de répartition 
d'une variable aléatoire (ou d'un système de variables 
aléatoires) d'après les données statistiques 


Nous avons déjà mentionné que les lois observées dans les séries 
de faits aléatoires sont d'autant plus exactes et mieux prononcées 
que tes données statistiques dont on dispose sont abondantes. Lors 
du traitement d'un grand nombre de données statistiques souvent 
il y a lieu de déterminer les lois de répartition de telles ou telles 
variables aléatoires. 

Théoriquement, lorsque le nombre d'expériences est suffisant. 
les lois propres à ces variables aléatoires peuvent se manifester 
d’une manière aussi précise que l’on veut. Dans la pratique on a tou- 
jours affaire à un nombre limité de données expérimentales; donc 
dans les résultats d'observations et de traitèément est présent tou- 
jours un élément du hasard plus ou moins prononcé. Le problème 
qui se pose est de savoir reconnaître les propriétés stables, réelle- 
ment propres au phénomène étudié et les distinguer des éléments 
aléatoires, apparaissant dans une certaine série de mesures et liés 
au nombre limité de données expérimentales. 

11 est naturel d'exiger de la méthode de traitement des données 
expérimentales de conserver, dans la mesure du possible, les traits 
caractéristiques, typiques du phénomène observé et de rejeter ce qui 
n'est pas important, secondaire, lié à une quantité insuffisante de 
données expérimentales. On voit ainsi apparaître un problème 
typique de mathématiques statistiques, problème de lissage des 
données statistiques, de leur représentation compacte par des 
relations analytiques simples. 


2. Vérification de la vraisemblance 
des hypothèses 


Ce problème est étroitement lié au précédent. Comme les données 
statistiques dont on dispose ne sont pas, en général, suffisantes pour 
que les lois statistiques apparaissant ne soient pas aléatoires, ces 
données peuvent seulement, avec un certain degré de certitude, con- 
firmer ou ne pas confirmer telle ou telle hypothèse. On peut par 
exemple se demander si les résultats des expériences sont en accord 
avec l’hypothèse suivant laquelle la variable aléatoire en question 
suit la loi de répartition F Ge 

Une autre question possible est de savoir si la tendance observée 
dans l'expérience vers une certaine loi exprime une relation réelle 
entre les variables aléatoires étudiées ou bien elle est due a des 
causes aléatoires liées à une insuffisance de données. Pour résoudre 
ces problèmes, des méthodes spéciales ont été élaborées en 
statistique. 
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3. Recherche des paramètres inconnus 
d'une loi de répartition 


Il ne s'agit pas toujours lors du traitement des.données statisti- 
ques de déterminer les lois de répartition des variables aléatoires étu- 
diées. Le plus souvent ceci est lié à une quantité insuffisante de don- 
nées expérimentales. Parfois on connaît d'avance le type de la loi de 
répartition à partir des considérations théoriques; par exemple, on 
peut affirmer d'avance que la variable aléatoire en question suit une 
loi normale. Alors le problème que doit résoudre le traitement des 
observations devient plus restreint ; on se propose de déterminer seu- 
lement certains paramètres (caractéristiques numériques) d’une 
variable aléatoire ou d’un système de variables aléatoires. Lorsque le 
nombre d'expériences est insuffisant on ne peut déterminer ces para- 
mètres d’une manière plus ou moins précise ; dans ces cas les données 
expérimentales sont dans une forte mesure aléatoires, donc tous les 
paramètres calculés à partir de ces données se trouvent également 
aléatoires. Dans ces conditions il peut seulement être question 
des « estimations » des paramètres cherchés, c’est-à-dire des valeurs 
approchées telles que, appliquées dans un grand nombre de cas, elles 
conduiraient en moyenne à des erreurs moindres que toutes autres. 
La recherche des valeurs approchées des caractéristiques numériques 
est étroitement liée à l'estimation de leur précision et de leur fiabilité. 
Nous rencontrerons des problèmes de ce genre dans le chapitre 14. 

Nous avons là une liste, loin d’être complète, des problèmes fonda- 
mentaux des mathématiques statistiques. Nous n avons énuméré 
que les problèmes les plus importants pour les applications pratiques. 
Dans le présent chapitre nous allons exposer quelques problèmes des 
plus élémentaires de la statistique et les méthodes de leur résolution. 


7.2. Ensemble statistique simple. Fonction 
de répartition statistique 


Soit une certaine variable aléatoire X, dont la loi de répartition 
est inconnue. Il y a lieu de trouver cette loi à partir de l'expérience ou 
de vérifier expérimentalement l'hypothèse suivant laquelle X suit 
telle ou telle loi. A cet effet la variable aléatoire À est soumise à 
une série d'expériences indépendantes (observations). Dans chacune 
de ces expériences la variable aléatoire X prend une certaine valeur. 
L'ensemble des valeurs observées de cette variable n'est autre chose 
que les données statistiques primaires devant être traitées, étudiées, 
analysées. Un tel ensemble est appelé « ensemble statistique simple » 
ou «suite statistique simple». 11 est d'usage de rassembler ces valeurs 
dans un tableau dans la première colonne duquel se trouve le numéro 
de l'expérience i et dans la seconde, la valeur observée de la variable 
aléatoire. 
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Exemple 1. La variable aléatoire $ est l'angle de glissement *) d'un 
avion lors du parachutage. Vingt parachutistes ont sauté. et chaque fois l’angle f 
a été enregistré en millièmes de radian. Les résultats des observations sont ras- 
semblés dans le tableau. 


î À è pipatsla. B; | L | P; 
Î — 20 8 — 30 15 — 10 
2 — 60 9 120 16 20 
3 — 10 10 — 100 17 30 
4 30 11 — 80 18 — 80 
5 GO 12 20 19 60 
6 70 12 40 20 70 
7 — {0 14 — 60 


La suite statistique — est une forme primaire d'écriture des 
données statistiques et peut être traitée de différentes manières. L'une 
des méthodes de traitement est la recherche de la fonction de répar- 
tilion statistique d'une variable aléatoire. 

On appelle fonction de répartition statistique (ou empirique) de la 
variable aléatoire X la fréquence de l'événement X << x dans les données 


statistiques: 
F*(1 =P*(X< 2). (7.2.1) 
Pour trouver la valeur de la fonction de répartition statistique 
pour x donné il suffit de compter le nombre d’ expériences dans les- 
quelles X << x et de le diviser par le nombre total n d'expériences 
effectuces. 


Exemple 2. Construire la fonction de répartition statistique pour 
la variable à lédtoire B de l'exemple 1. 


50 100 F 


Fig. 7.2.1 


Solution. La valeur minimale observée de B étant —100, on a 
F (—100) = 0. La valeur —100 a été observée une fois, sa fréquence est donc 


*) On entend par + angle de glissement » l'angle formé par le vecteur 
vitesse et le plan de symétrie de l'avion. 
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égale a 1/20; par conséquent au point —100 la fonction #* (B) fait un saut égal 
à 1/20. Dans l'intervalle de —100 à —80 la fonction F* (B) demeure égale 
à 1/20 ; au point —80 la fonction F* (f) fait un saut de 2/20 car la valeur —8U 
a été observée deux fois. etc. 


Le graphique de la fonction F* (B) est donné sur la figure 7.2.1. 


La fonction de répartition statistique d’une variable aléatoire 
quelconque, continue ou discrète, est toujours une fonction en esca- 
lier dont les échelons correspondent aux valeurs observées de la varia- 
ble aléatoire et sont égaux en grandeur aux fréquences de ces valeurs. 
Si chaque valeur d’une variable aléatoire a été observée exactement 
une fois, le saut de la fonction de répartition statistique pour chaque 
valeur observée est égal à 1/n, où n est le nombre d'observations. 

Lorsque le nombre d'expériences r augmente, conformément au 
théorème de Bernoulli, pour z quelconque la fréquence de l'événe- 
ment X << x tend (en probabilité) vers la probabilité de cet événe- 
ment. Par conséquent, lorsque nr augmente la fonction de répartition 
F * (x) tend (en probabilité) vers la vraie fonction de répartition 
F (x) de la variable aléatoire X. 

Si X est une variable aléatoire continue, lorsque le nombre d'’ob- 
servations nr augmente, le nombre de sauts de la fonction F * (x) 
auemente également, la valeur de ces sauts diminue et le graphique 
de la fonction F* (x) tend indéfiniment vers la courbe continue F (x) 
de la fonction de répartition de X. 

En principe, trouver la fonction de répartition statistique c'est 
déjà dépouiller les données expérimentales. Cependant lorsque le 
nombre d'expériences n est important, il est difficile de trouver 
F * (x) par la méthode décrite ci-dessus. De plus, souvent pour plus 
de clarté il est commode d'utiliser d’autres caractéristiques des répar- 
titions statistiques, analogues non pas à ka fonction de répartition 
F (x) mais à la densité f (x). Nous verrons dans le paragraphe suivant 
des méthodes de ce genre de description des données statistiques. 


7.3. Suite statistique. Histogramme 


Lorsque le nombre d'observations est important (de l'ordre de 
centaines) un ensemble statistique simple n’est plus une forme com- 
mode de description des données statistiques, car il devient volumi- 
neux et peu clair. Pour présenter les données statistiques sous une 
forme plus compacte et ordonnée on les soumet à un traitement com- 
plémentaire, en l’occurrence on établit une suite statistique. 

Supposons que nous ayons à notre disposition les résultats des 
observations sur la variable aléatoire continue X sous la forme d'un 
ensemble statistique simple. Nous allons diviser la gamme des va- 
leurs observées de X en intervalles, ou rangs, et compter le nombre de 
valeurs m, correspondant à chaque i-ème rang. Puis, divisant ce 
nombre par le nombre total d'observations nr nous trouvons la fré- 
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quence correspondant à un rang donné: 


# mi 


Pi ÈS : (7.3.1) 
La somme des fréquences de tous les rangs doit évidemment être 
égale à l'unité. 


I1 est d'usage de rassembler les fréquences dans un tableau où 


les rangs sont disposés dans l’ordre croissant. On appelle ce tableau 
suile statistique : 


I, désigne ici l'i-ème rang; xs, zi+, Ses limites; p? la fréquence cor- 
respondante; À le nombre de rangs. 


Exemple 1. On effectue 500 mesures de l'erreur de pointage en dérive 
lors du tir à partir d’un avion sur une cible terrestre. Les résultats des mesures 
(en millièmes de radian) sont rassemblés dans le tableau: 


TI; — à ; —3 —3; —2 


| 
25) 0) 0:1 | 4; 2 252] 356 


0,012 


050 | oi | 0,266 


6 | 25 | 72 3e 120 se as 10 
oo | 0, re | ve | 0,020 


I; désigne ici l’intervalle des valeurs des erreurs de pointage; m; le nombre 


d'observations dans l'intervalle, p? — _ la fréquence correspondante. 


Lors du groupement des valeurs observées de la variable aléatoire 
il faut souvent décider où rapporter une valeur se trouvant à la limite 
de deux rangs. Dans de tels cas il est conseillé de considérer la valeur 
en question comme appartenant en égale mesure aux deux rangs et 
d'ajouter aux nombres m, des deux rangs la quantité 1/2. 

Le nombre de rangs de groupement des données statistiques ne 
doit pas être trop important (autrement la suite devient peu représen- 
tative et les fréquences accusent une irrégularité) ; il ne doit pas non 
plus être trop petit (lorsque le nombre de rangs est trop petit les pro- 
[Eee de la répartition ne sont décrites que trop grossièrement par 

suite statistique). L'expérience montre que dans la majorité 
des cas le nombre de rangs doit se trouver entre 10 et 20. Plus les 
données statistiques sont complètes et homogènes, plus grand peut 


U— 2823 
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être le nombre de rangs de la suite statistique. Les rangs peuvent être 
de même longueur ou de longueurs différentes. Il est évidemment plus 
simple de les prendre de même longueur. Cependant lors du traite- 
ment des données sur les variables aléatoires réparties d’une manière 
très irrégulière, il est parfois commode de prendre dans le domaine 
de densité élevée des intervalles plus etroits que dans le domaine de 
densité faible. 

Les suites statistiques sont souvent représentées graphiquement 
sous la forme d’histogrammes. Pour construire un histogramme on 
porte sur l’axe des abscisses les intervalles de classement sur cha- 
cun desquels, pris pour base, on construit un rectangle d’aire égale à la 


K 


fréquence du rang en question. Evidemment, la hauteur de chaque 
rectangle se trouve par division de la fréquence du rang par sa lon- 
gueur. Lorsque les rangs sont de même longueur, les hauteurs des rec- 
tangles sont proportionnelles aux fréquences correspondantes. Il dé- 
coule de la méthode de construction de l’histogramme que son aire 
doit être égale à à l'unité. 

A titre d'exemple on peut construire l’histogramme à partir des 
données de l'exemple 1 (fig. 7.3.1). 

Il est évident qu'au fur et à mesure de l'augmentation du nombre 
d'expériences on peut prendre les intervalles de classement de plus 
en plus petits; l'histogramme se rapprochera alors de plus en plus 
d'une certaine courbe limitant une surface d’aire égale à l'unité. 
Il est facile de voir que cette courbe n’est rien d'autre que le graphi- 
que de la densité de probabilité de la variable X. 

En utilisant les données de la suite statistique on peut également 
trouver approximativement la fonction de répartition statistique de 
X. Il serait trop coûteux et inutile de chercher la fonction de répar- 
tition exacte avec ses plusieurs centaines de paliers pour toutes les 
valeurs observées de X. Dans des fins pratiques il suffit de construire 
la fonction de répartition par plusieurs points. Ces points peuvent 
être les limites z;, z2, . . . des intervalles figurant dans la suite sta- 
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tistique. On a alors de toute évidence: 
F*(x1)=0; 
F*(x2)= pi; 
F*(xs)== pt! pi: 
oi. © 732 
F* (x) = 2 Pi ; 


k 
ds (4)= 2 pi=1. 


En réunissant les points par une ligne brisée ou par une courbe 
continue on obtient le graphique approché de la, fonction de répar- 
tition. 

Exemple 2. Construire la fonction derépartition statistique approchée 
de l'erreur de pointage d'après les données de l'exemple 1. 


4 3 2 1 0 1] £L  J #4 TI 
Fig. 7.3.2 


Solution. D'après les formules (7.3.2) on a: 
F*(—4) =0;, F*(—3) = 0,012; F*(—2) = 0,012 + 0,050 — 0,062; 
F#(—1) — 0.206; F*(0) = 0,472; F% (1) — 0,712; 
F®* (2) = 0,888; 
F* (3) = 0,980: F* (4) -: 1.000. 


Sur la figure 7.3.2 on peut voir le graphique de la fonction de répartition 
statistique approchéc. 


7.4. Caractéristiques numériques d’une répartition 
statistique 


Au chapitre 5 nous avons étudié différentes caractéristiques numé- 
riques des variables aléatoires, à savoir l'espérance mathématique, la 
variance, les moments initiaux et centrés d’ordre différents. Ces carac- 


Os 
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téristiques numériques jouent un rôle important dans la théorie des 
probabilités. A toute caractéristique numérique de la variable aléatoi- 
re À correspond une caractéristique analogue statistique. A la carac- 
téristique fondamentale de position, l'espérance mathématique 
d'une variable aléatoire, correspond la moyenne arithmétique des 


valeurs observées : 
ñn 


DE 


M°IX]= = — , (7.4.1) 


où z; est la valeur observée dans l’i-ème expérience, »r le nombre d'ex- 
périences. 

Dans la suite nous allons appeler cette caractéristique moyenne 
statistique d’une variable aléatoire. 

En vertu de la loi des grands nombres, lorsque le nombre d’ex- 
périences augmente la moyenne statistique tend (en probabilité) 
vers l'espérance mathématique. Pour un nr suffisamment grand la 
moyenne statistique peut approximativement être prise égale à l’es- 
pérance mathématique. Lorsque le nombre d'expériences est peu 
élevé, la moyenne statistique est une variable aléatoire qui néan- 
moins est liée à l’espérance mathématique et permet de s’en faire 
une assez bonne idée. 

Des caractéristiques statistiques analogues existent pour toutes 
caractéristiques numériques. Nous les marquons d’un astérisque pour 
les distinguer des caractéristiques numériques correspondantes. 

Soit par exemple la variance d’une variable aléatoire, c’est l’es- 


pérance mathématique de la variable aléatoire x: = (X — m.): 
DIX]= MIX =MI(X—m.)]. (7.4.2) 


Si dans cette expression on remplace l'espérance mathématique 
par la moyenné arithmétique on obtient la variance statistique de X : 


D) (zi—m2)? 
DIX = — 


n 


(7.4.3) 


où m?— M * [X] est la moyenne statistique. 
D'une manière analogue on définit les moments statistiques ini- 
tiaux et centrés d'ordre quelconque: 


at (X]= =, (7.4.4) 


(7.4.5) 
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Toutes ces définitions sont analogues à célles du chapitre 5 pour 
les caractéristiques numériques des variables aléatoires, avec cette 
seule différence qu'au lieu de l'espérance mathématique on a partout 
la moyenne arithmétique. Lorsque le nombre d'observations augmen- 
te, il est clair que toutes les caractéristiques statistiques converge- 
ront en probabilité vers les caractéristiques mathématiques corres- 
pondantes et pour rx suffisamment grand peuvent être confondues 
avec celles-ci. 

On peut facilement montrer que les moments initiaux et centrés 
statistiques possèdent les mêmes propriétés que les moments mathé- 
matiques. En particulier, le moment centré statistique du premier 
ordre est toujours nul: 


Les relations signalées entre les moments centrés et initiaux res- 
tent également les mêmes: 


ñn n n 
> “ : ic à Éd à . 
u? = D? = HER EE LR —— + (mi) = a — (mx)®, 


(7.4.6) 
etc. | 
Lorsque le nombre d'expériences est très important le calcul des 
caractéristiques d'après les formules (7.4.1)-(7.4.5) devient trop 
compliqué. On peut alors recourir à une méthode approchée qui con- 
siste à répartir les données par intervalles de classement, tout comme 
ceci a été fait pour la construction de la suite statistique ou de l'his- 
togramme. et à considérer qu'à l'intérieur de chaque intervalle la 
valeur de la variable aléatoire est constante et égale à sa valeur movyen- 
ne qui devient ainsi la valeur représentative ou le « représentant » 
de l'intervalle. Les caractéristiques statistiques numériques s’ex- 
primeront alors approximativement par les formules : 


k 
m?=M°[X]= D xip*, (7.4.7) 
i=1 
h en’ 
D?= D'IX]= D (x —m#) p?, (7.4.8) 
ii 
R Connd 
af[X]= 2 zip? (7.4.9) 
i-.! 
h 


R'IXI= 2 (ri ms) pt, (7.4.10) 
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ici z, est la valeur représentative du i-ème intervalle; pÿ la fréquen- 
ce du i-ème intervalle: 4 le nombre d'intervalles. 

On voit que les formules (7.4.7)-(7.4.10) sont analogues aux for- 
mules des $$ 5.6 et 5.7 définissant l'espérance mathématique, la 
variance, les moments initiaux et centrés de la variable aléatoire 
continue À, avec cette seule différence que les probabilités p; y sont 
remplacées par les fréquences p?, l'espérance mathématique m, par 
la moyenne statistique m£, le nombre de valeurs possibles de la va- 
riable aléatoire par le nombre d'’intervalles. 

La majorité des cours de théorie des probabilités et de statistique 
mathématique utilisent pour les caractéristiques statistiques analo- 
gues aux caractéristiques numériques des variables aléatoires une ter- 
minologie différente; plus exactement la moyenne statistique est 
appelée « moyenne échantillonnée», la variance statistique « va- 
riance échantillonnée », etc. L'origine de ces termes peut s'ex- 
pliquer comme suit: en statistique, surtout rurale et biologique, on 
utilise souvent des distributions de tel ou tel indice pour un ensem- 
ble important d'éléments (d'individus), formant une collectivité 
statistique (cet indice peut par exemple être la teneur en albumen des 
graines de blé, le poids de ces mêmes graines, la taille et le poids 
d'une bête, etc.). Cet indice est une variable aléatoire dont la valeur 
change d'un individu à l’autre. Cependant pour pouvoir se faire une 
idée de la répartition de cette variable aléatoire ou de ses caractéristi- 
ques principales il n’est pas indispensable d'étudier chaque individu 
de la collectivité ; on peut étudier un certain échantillon suffisamment 
grand pour qu'apparaissent les traits essentiels de la loi étudiée. 
L'ensemble dans lequel on prélève l'échantillon s'appelle en statis- 
tique grand ensemble. On suppose que le nombre d'éléments (d’indi- 
vidus) # de l’ensemble est très important, et le nombre d'éléments n 
d'un échantillon est limité. Lorsque W est suffisamment grand les 
propriétés des distributions échantillonnées (statistiques) et des carac- 
téristiques ne dépendent pratiquement pas de W ; d'où l’idéalisation 
mathématique en vertu de laquelle l’ensemble dont sont issus les 
échantillons est de taille infinie. On distingue alors les caractéristi- 
ques exactes (lois de répartition, espérance mathématique, variance, 
etc.) du grand ensemble des caractéristiques analogues échantillon- 
nées. Les caractéristiques échantillonnées diffèrent des caractéris- 
tiques correspondantes du grand ensemble par suite de la taille 
limitée r de l'échantillon; lorsque nr augmente indéfiniment, il est 
évident que toutes les caractéristiques tendent (convergent en proba- 
bilité) vers les caractéristiques correspondantes du grand ensemble. 
Souvent il y a lieu de trouver la taille r de l'échantillon suffisante 
pour pouvoir déterminer avec une précision requise à partir des 
caractéristiques échantillonnées, les caractéristiques du grand en- 
semble ou bien la précision avec laquelle, pour une taille donnée de 
l'échantillon, on peut connaître les caractéristiques du grand en- 
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semble. Cette méthode d’une étude parallèle d’un grand ensemble in- 
fini, dans lequel on prélève un échantillon, et d’un échantillon de 
taille limitée est tout à fait naturelle dans le cas où les collectivités 
étudiées sont vraiment très populeuses. Cependant dans un grand nom- 
bre de problèmes, il ne s'agit pas de choisir un échantillon dans un 
grand ensemble d'éléments mais spécialement effectuer une expérien- 
ce pour étudier telle ou telle variable aléatoire, sa loi ou ses caracté- 
ristiques numériques. Par exemple, pour l’étude des erreurs de guida- 
ge par une station radar d'un appareil cosmique, il peut s'avérer né- 
cessaire d'effectuer des expériences spéciales ; il en est de même lors- 
que des expériences sont réalisées dans le but de voir si tel ou tel fac- 
teur est nuisible à la vie d’un être vivant, ou bien quand on effectue 
des lancements de fusées dans le but de trouver les caractéristiques 
de dispersion, etc. Dans ces conditions le nombre d'expériences est 
limité non pas par des difficultés d'enregistrement ou de traite- 
ment, mais par la complexité et le coût de chaque expérience. Il 
est évident que dans ce cas également on peut envisager les n expé- 
riences effectuées comme un échantillon issu d'un grand ensemble 
quelconque constitué d’un nombre infiniment grand d'expériences 
possibles, réalisables en principe dans les conditions en question. 
Cependant ce point de vue n’est pas justifié par la nature des problè- 
mes étudiés et serait une idéalisation inutile. C’est pourquoi dans le 
présent ouvrage nous n'utilisons pas les termes traditionnels: 


« moyenne échantillonnée », « variance échantillonnée », « caracté- 
ristiques éghantillonnées », etc. en employant à leur place les termes 
équivalents de « moyenne statistique», « variance statistique », 


« caractéristiques statistiques », etc. 


7.5. Approximation des données statistiques 


Dans toute distribution statistique le hasard intervient dans une 
mesure plus ou moins grande, ceci étant lié au fait que le nombre 
d'expériences est limité, que les expériences effectuées ont été choi- 
sies au hasard parmi d’autres et donc les résultats qu'elles ont fournis 
sont également aléatoires. Ce n’est que si le nombre d’ expériences 
est très grand que le hasard joue un rôle de moins en moins impor- 
tant et dans le phénomène aléatoire se manifeste alors nettement 1la 
loi qui lui est propre. Dans la pratique on n'a presque jamais affaire 
à un nombre aussi important d'expériences et on est obligé à compter 
avec le hasard. C’est pourquoi lors du traitement des données statis- 
tiques il importe de savoir choisir la courbe théorique approchant 
une suite statistique de façon à exprimer les traits essentiels des don- 
nées statistiques mais non les traits accidentels provenant d'une 
insuffisance de données expérimentales. C’est ce qui s'appelle l'ap- 
proximation des données statistiques. 

Le problème consiste à trouver une courbe théorique continue, qui 
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d'un certain point de vue donne une meilleure description des données 
statistiques en question (fig. 7.5.1). 

La recherche de la meilleure approximation des données statisti- 
ques, tout comme n'importe quel problème de meilleure représenta- 
tion analytique d'une fonction empirique, est un problème assez 
vaguement déterminé et sa solution dépend de ce qu’on entend par 
« meilleur ». Par exemple, très répandue est la méthode dite des moin- 
dres carrés (voir $ 14.5) suivant laquelle la meilleure approximation 
d’une relation empirique pour une classe donnée de fonctions est 


Fig. 7.5.1 


celle où la somme des carrés des écarts est minimale. La classe de 
fonctions où l’on cherche cette meilleure approximation est choisie 
non pas à partir des considérations mathématiques mais en se basant 
sur le sens physique du problème à résoudre, compte tenu du carac- 
tère de la courbe empirique obtenue et de la précision des obser- 
vations. Souvent on connaît d'avance la forme de la fonction expri- 
mant la relation étudiée, l'expérience devant seulement fournir un 
certain nombre de paramètres numériques entrant dans l'expression 
de la fonction; ce sont justement ces paramètres que l’on détermine 
par la méthode des moindres carrés. 

Il en est de même du problème d'approximation des données 
statistiques. En général, la forme de la courbe théorique est choisie 
d'avance à partir de considérations physiques et dans certains cas 
elle est prédéterminée par la répartition statistique. L'approximation 
des données statistiques revient au choix rationnel des valeurs des 
paramètres de la courbe approchée pour lesquels les distributions 
statistique et théorique se correspondent le mieux. 

Soit par exemple X l'erreur de mesure provenant de l’action con- 
jointe d'un grand nombre d'erreurs élémentaires; des considéra- 
tions théoriques suggèrent que X suit une loi normale de densité 

1 7.5.1 
(a=Ee 7 (7.5.1) 
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et le problème du lissage revient à celui du choix rationnel des para- 
mètres m et © dans l'expression (7.5.1). 

Parfois on sait d'avance que X est répartie à peu près uniformé- 
ment sur un certain intervalle; le problème consiste alors à choisir 
convenablement les paramètres de la loi de densité uniforme: 


_—— pour a<z<$f, 


Lu nt LP 
O pour z<a ou z>$ 


pouvant approcher de la meilleure façon la répartition statistique 
en question. 

11 ne faut pas oublier que toute fonction analytique f (x) permet- 
tant d'approcher une distribution empirique doit avoir les proprié- 
tés essentielles d’une densité de probabilité, à savoir: 


f(x)>0; 


[ fe) dr=1. (7.5.2) 


Soit f (x) une fonction satisfaisant aux conditions (7.5.2), choisie 
pour approcher une certaine répartition statistique; cette fonction 
contient plusieurs paramètres a, b, . ..,; il y a lieu de trouver ces 
paramètres de telle sorte que la fonction f (x) décrive au mieux les 
données statistiques en question. L'une des méthodes utilisées pour 
résoudre ce problème est la méthode des moments. 

En vertu de la méthode des moments, les paramètres a, b, ... 
sont choisis de telle sorte que plusieurs caractéristiques numériques 
importantes (moments) de la répartition théorique soient égales aux 
caractéristiques statistiques correspondantes. Par exemple, si la 
courbe théorique f (x) comporte seulement deux paramètres a et b, 
on les choisit de façon à assurer que l’espérance mathématique m. 
et la variance D, de la répartition théorique soient égales aux caracté- 
ristiques statistiques m£ et D? correspondantes. Si la courbe f (zx) 
comporte trois paramètres on peut les choisir de telle sorte que coiïn- 
cident les trois premiers moments, etc. Très utile dans la description 
des données statistiques peut s'avérer un système spécial de courbes 
de Pearson dont chacune dépend dans le cas général de quatre para- 
mètres, lesquels sont choisis de manière à conserver les quatre pre- 
miers moments dela répartition statistique (espérance mathématique, 
varisnce, moments trois et quatre). N. Borodatschev *) a donné 
un système fort intéressant de courbes de répartition en se basant 
sur un autre principe. Il a proposé de choisir le type de la courbe théo- 


*) N. Borodatschev. Fondements de la théorie de la précision industrielle 
(en russe). Ed. de l’Acad. des Sciences de l’U.R.S.S., Moscou, 1950. 
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rique non pas à partir des indices formels, mais en analysant la na- 
ture physique du phénomène ou du processus aléatoire étudié. 

I1 faut noter que dans la description des données statistiques l’uti- 
lisation des moments d'ordre supérieur au quatrième est dénuée 
de sens, car la précision du calcul des moments diminue rapidement 
lorsque leur ordre augmente. 


Exemple 1. Dans l'exemple 1 du 8 7.3 nous avons donné la réparti- 
tion statistique de l'erreur de pointage en dérive X lorsqu'un avion tire sur une 
cible terrestre. Approcher cette répartition par la loi normale: 


_(æ=m)i 
23 
[E&=—>e 
o V2n 
Solution. La loi normale dépend de deux paramètres: m et ©. Choisis- 
sons ces paramètres de façon à conserver les deux premiers moments — l’espé- 
rance mathématique et la variance — de la répartition statistique. 


Calculons approximativement la moyenne statistique de l’erreur de poin- 


tage par la formule Its -4.7). en prenant pour valeur représentative de chaque 
intervalle sa valeur de milieu, il vient: 


mx = —3,5-0,012—2,5 0,050 — 1,5-0,144 — 0,5-0.266 + 
+ 0,5-0,240 + 1,5:0,176 + 2,5-0,092 + 3,5-0,020 — 0,168. 


Pour trouver la variance nous allons calculer tout d’abord le moment 
initial deux par la formule (7.4.9) en posant s — 2, k — 8: 


a? =ÿ z3p? — 2,126. 


En exprimant la variance en fonction du moment initial deux d’après 
la formule (7.4.6) on a: 


Dr—at —(m?)2=— 2,126 — 0,028 — 2,098. 


Choisissons les paramètres m et © de la loi normale de telle sorte que soient 
remplies les conditions: 
m—=m; o2=D%, 
donc 
m = 0,168; © = 1,448. 


La loi normale s'écrit donc: 
; _(x-0,168)2 
2-1,4483 
TL) = — 
DE 1,448 V' 2x 


En utilisant la table 3 de l'annexe calculons les valeurs de f (z) aux limites 
des intervalles: 


Zz || 1 


lc 2 ls 


Î (x) 08 [0,6 |0.0 ous 0.274] 0,206[0,12 [0.0.0 
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La figure 7.5.2 montre l’histogramme et la courbe de répartition approchée. 
On remarque que la courbe théorique f (r), tout en conservant les parti- 
cularités essentielles de la répartition statistique, est parfaitement régulière. 


Les irrégularités qu'accuse l’histogramme sont évidemment dues à des causes 
aléatoires; dans le paragraphe suivant nous allons donner un fondement plus 
sérieux à cette assertion. 


Nota: Dans le présent exemple lors du calcul de D; nous avons 
utilisé l'expression (7.4.6) donnant la variance statistique en fonc- 
tion du moment initial deux. On peut recommander cette méthode 
seulement si l'espérance mathématique m; de la variable aléatoire 
étudiée X est peu importante; dans le cas contraire la formule 
(7.4.6) exprime la variance D? en tant que différence de nombres 
voisins et se trouve être d’une précision médiocre. Dans ce cas on 
peut recommander soit de calculer D? directement par la formule 
(7.4.3), soit de transférer l'origine des coordonnées en un point quel- 
conque voisin de m* et d’appliquer ensuite la formule (7.4.6). Uti- 
liser la formule (7.4.3) équivaut à situer l'origine des coordonnées 
au point m*; mais ceci n'est pas toujours commode car l'expression 
de m* peut être fractionnaire, or, la soustraction d'une fraction de 
chaque x; complique considérablement les calculs; dans ce cas il y a 
lieu de transporter l'origine des coordonnées en un point x d’abscisse 
entière, voisin de m<. 


Exemple 2. Dans le but d'étudicr la lai de répartition de l'erreur 
de mesure de la distance à l’aide d’un radioaltimetre on effectue 400 mesures 
ee distance. Les résultats des expériences «<ont rassemblés dans Île 
tableau : 
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Ti (m)120 ; s0|s0; |; soso co|s0 QUE soso; v0| 20; 100 


0,128| 0,140 


0,095 


p* 0.062 | 80 | 0,165 160 | 0,080 . 


Décrire ces données statistiques par la loi de densité uniforme. 
Solution. La loi de densité uniforme s'exprime par la formule: 


| — pour a<r <f, 


0 pour z<aouxr>$ 


et dépend de deux paramètres & et B. Ces paramètres doivent être choisis de 
manière à conserver les deux premiers moments de la répartition statistique, 
à savoir l'espérance mathématique m* et la variance D. Exprimons l'espérance 


mathématique et la variance d’une loi de densité uniforme comme indiqué dans 
l'exemple du 6 5.8: 


Mr , 


_a+B 

7 2 
__(B— a)? 

De 5— 


Pour simplifier les.calculs liés à la détermination des moments statistiques 
plaçons l’origine des coordonnées au point rs — 60 et prenons pour valeur repré- 
sentative de chaque intervalle la valeur de milieu. Le tableau ci-dessus devient : 


— 9 5 15 25 35 


— 35 | — 25 | —15 


0,052 0,165 


0,160 0,80 


0,095 0,128 | 0,140 


0.180 


où zi est la valeur moyenne de l'erreur X’ du radioaltimètre dans unintervalle 


après le changement d'origine. 
La valeur approchée de la moyenne statistique de l'erréur X’ cest: 


R 
me, = ÿ zip? = 0,26. 
i=1 


ii 


Le moment statistique deux de X”’ vaut: 
R 
aï— 9 (7:)2 p? = 447,8, 
i=1 
d’où la variance statistique: 
D?,— af —(m£,)?— 447,7. 


En passant à l'origine initiale on obtient une nouvelle moyenne statistique: 
m% = m®, +60 — 60,26 
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et la mêmo variance statistique 
D = D?,= 447,1. 
Les paramètres de la loi de densité uniforme sont donnés par Îles équations 


a+$ _ .. (B—a)_ 
9 — 60,26 , 142 = 447,7. 


Fig. 7.5.3 


La solution de ces équations par rapport à &« et B donne 
a = 23,6; B = 96,9, 
d'où 
Î FR ER = 0,0136 
B—a 73,3 ° | 


Sur la figure 7.5.3 on peut voir l’histogramme et la loi de densité uniforme 
f (x) approchée. 


7.6. Critères de conformité 


Dans ce paragraphe nous allons étudier une des questions liées 
à la vraisemblance des hypothèses; il s’agit de la conformité des 
répartitions théorique et statistique. 

Supposons qu'une répartition statistique soit approchée par la 
courbe théorique f (x) (fig. 7.6.1). Même si la courbe théorique est 
bien choisie, certains écarts entre celle-ci et la répartition statistique 
sont inévitables. Une question se pose tout naturellement : ces écarts, 
sont-ils dus uniquement au hasard, vu le nombre limité d'observa- 
tions, ou bien sont-ils essentiels et proviennent de ce que nous avons 
mal choisi la courbe de lissage de la répartition statistique étudiée ? 
Pour répondre à cette question on fait appel aux critères de conformité. 

Voyons le sens à attribuer à la notion de critère de conformité. 
En se basant sur certaines données statistiques il y a lieu de vérifier 
l'hypothèse Æ selon laquelle la variable aléatoire X suit une certaine 
loi de répartition. Cette loi peut être donnée sous une forme quelcon- 
que: comme la fonction de répartition F (x), comme la densité de 
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probabilité f (x) ou comme un ensemble des probabilités p;, où p: 
est la probabilité pour À de tomber dans l'i-ème intervalle. 

Etant donné que la forme F (x) est la plus générale et détermine 
toutes les autres, nous allons considérer que l'hypothèse H sera juste- 
ment en ce que la variable X a F (X) pour fonction de répartition. 

Pour adopter ou rejeter l'hypothèse H considérons une certaine 
grandeur U caractérisant la différence entre les répartitions statisti- 
que et théorique. La grandeur U peut être choisie de plusieurs façons; 


XL 


Y 


= 
DSC R 


Fig. 7.6.1 


par exemple, on peut prendre la somme des carrés des écarts des pro- 
babilités théoriques p, des fréquences correspondantes p?, ou la som- 
me des mêmes carrés mais pondérés par certains coefficients (poids) 
ou l'écart maximal de la fonction de répartition statistique F* (x) 
de la fonction théorique F (x), etc. Supposons que d’une manière 
ou d’une autre on ait choisi la grandeur U. Il est évident que c'est 
une certaine variable aléatoire. Sa loi de répartition dépend de celle 
de la variable aléatoire X ayant fait l'objet des expériences et du 
nombre d'expériences #7. Si l'hypothèse Æ est vraie, la loi de répar- 
tition de U est déterminée par la loi de répartition de X (fonction 
F (x)) et ke nombre nr. 

Supposons que nous connaissions cette loi de répartition. On 
a trouvé que dans une série d'expériences la mesure U que nous avons 
choisie pour évaluer l'écart a pris une certaine valeur u. La question 
qui se pose est de savoir si ceci peut s'expliquer par le hasard ou si 
cette valeur est trop importante et indique qu'il y a une différence 
essentielle entre les répartitions théorique et statistique et par con- 
séquent l'hypothèse } n'est pas vraie. Pour répondre à cette question 
on suppose que l’hypothèse FX est vraie et on calcule dans cette hypo- 
thèse la probabilite de l'événement suivant dû aux causes aléatoires : 


U > u. 


Si cette probabilité est petite on doit rejeter l'hypothèse 77 comme 
peu vraisemblable; si cette différence est importante, il y a lieu 
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d'adopter que les données expérimentales ne sont pas en contradic- 
tion avec l'hypothèse 7. 

On se pose alors la question de savoir comment il faut choisir 
la mesure U. Il se trouve que dans certains cas la loi de répartition 
de U a des propriétés fort simples et pour nr suffisamment grand 
ne-dépend pratiquement pas de la fonction F (x). Ce sont ces mesures 
qui sont utilisées en mathématiques statistiques en qualité de critè- 
res de conformité. 

Soit par exemple l’un des critères des plus fréquemment utilisés, 
à savoir le « critère du X?» de Pearson. 

Supposons que l’on ait effectué nr expériences indépendantes dans 
chacune desquelles la variable aléatoire X a pris une certaine valeur. 
Les résultats des expériences sont classés en k intervalles et présentés 
sous la forme du tableau: 


Ti | Z4, T2 | Z2; Z3 | - | Zh; kKx+1 


. 
Pi 


Pi | pi | .…. | ph 

Il y a lieu de vérifier si les données expérimentales confirment 
l'hypothèse selon laquelle X suit la loi de répartition en question 
[donnée par la fonction de répartition F (rx) ou la densité f (x)]. 
Nous allons appeler cette loi de répartition « loi théorique ». 

Connaissant la loi de répartition théorique on peut trouver les 
probabilités théoriques p1, p2, - .., p, pour la variable aléatoire 
étudiée de se trouver dans l'intervalle correspondant. 

En vérifiant la conformité des répartitions théorique et statisti- 
que nous allons nous baser sur la différence entre les probabilites 
théoriques p; et les fréquences observées p?. Il est naturel de choisir 
pour mesure’ de lanon-conformité des répartitions théorique et 
statistique la somme des carrés des écarts (p* — pi) pris avec des 
« poids » ci: 


kR 
U= 2 ci (p* — pi)’. (7.6.1) 


Les coefficients c; (« poids » des intervalles) tiennent compte de l'im- 
portance relative différente des écarts mentionnés dans divers interval- 
les. En effet un écart p? — p;, de même valeur absolue peut être peu 
important si la probabilité est grande, et notable si elle est petite. 
C'est pourquoi il serait naturel de prendre les « poids » c, inversement 
proportionnels aux probabilités p, des intervalles. 

Alors il faut savoir choisir le coefficient de proportionnalité. 

Pearson a montré que si l’on pose 


n 


—, (7.6.2) 


pour des nr grands, la loi de répartition de U est douée de propriétés 
intéressantes: elle ne dépend pratiquement pas de la fonction de 


Ci = 
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répartition F (x) ni du nombre d'expériences nr, mais seulement du 
nombre d'intervalles de classement k en tendant vers la loi dite 
«du %*»*). 

Lorsque les coefficients c,; sont ainsi choisis, la mesure de la non- 
conformité est généralement désignée par %°: 


k 
(p? — pi)? 
pan D I. (7.6.3) 


im Î 


Pour rendre les calculs plus commodes (pour ne pas avoir à mani- 
puler avec des fractions avec un grand nombre de zéros) on peut intro- 


. . m « 
duire r sous le signe de la somme et, compte tenu de p? =—*, où 


m, est le nombre de valeurs dans l’i-ème intervalle, écrire la formule 
(7.6.3) comme suit: 


R 
== 2 
Ds = 5 EP, (7.6.4) 


ii 


La loi du y? dépend du paramètre r appelé degré de liberté de la ré- 
partition. Le nombre de degrés de liberté r est égal au nombre # 
de rangs moins celui des conditions indépendantes (contraintes) 
imposées aux fréquences p?. Donnons quelques exemples de telles 
conditions: 


si l’on exige seulement que la somme des fréquences relatives soit 
égale à l’unité (cette condition toujours imposée): ou 


R 
pp  … 
> LiPi = Me 
i= 1 


*) On appelle loi du +? à r degrés de liberté la répartition des carrés de r 
variables aléatoires indépendantes, dont chaeune est répartie suivant une loi 
normale d'espérance mathématique nulle et de variance unité La densité de 
cette répartition est 


u 
1 sir 


np cu e pour u > O, 
k, (u) = ( 


0 pour u 0, 
où Fr @= | t1%—le-t dt est la fonction Fr. 
(1 
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si l'on choisit la répartition théorique de telle sorte que les moyennes 
des répartitions théorique et statistique coïncident: ou encore 


k 
D (z:— mx) pi = De 
{== 1 


si l'on veut de plus que les variances théorique et statistique coïnci- 
dent, etc. 

Des tables spéciales ont éte établies pour la loi du #° (voir table 
4 de l'annexe). Ces tables permettent pour une valeur quelconque du +? 
et un nombre r de degrés de liberté de trouver la probabilité p pour 
une variable répartie suivant la loi du +? de dépasser cette valeur. Dans 
la table 4 on a porté comme paramètres la valeur de la probabilité p 
et le nombre r de degrés de liberté. Les cases de la table contiennent 
les valeurs correspondantes du #°. 

La loi du +* permet d'estimer le degré de conformité des réparti- 
tions théorique et statistique. Soit la variable X réellement répartie 
suivant la loi F (x). La probabilité p trouvée dans la table est la 
probabilité pour que la mesure de la non-conformité (7.6.4) des 
répartitions théorique et statistique à cause des actions accidentelles 
soit inférieure à la valeur du x? observée dans la série d'expériences 
en question. Si cette probabilité p est très petite (tellement petite 
que l’événement auquel elle se rapporte peut pratiquement être con- 
sidéré comme impossible), il y a lieu d'admettre que le résultat 
de l'expérience est en contradiction avec l'hypothèse A selon laquel- 
le F (x) est la loi de répartition de X. Cette hypothèse doit être rejetée 
comme non vraisemblable. Au contraire, si la probabilité p est rela- 
tivement importante, les écarts entre les répartitions théorique et 
statistique sont insignifiants et on peut les attribuer au ha- 
sard. L'hypothèse FH selon laquelle. X est répartie suivant la loi 
F (x) doit être considérée vraisemblable ou tout au moins non contra- 
dictoire aux données expérimentales. 

Ainsi l’utilisation du critère du +° pour estimer la conformité 
des répartitions théorique et statistique se réduit à : 

1) calculer la mesure de non-conformité y* par la formule (7.6.4): 

2) déterminer le nombre de degrés de liberté r en tant que nombre 
d'intervalles k moins le nombre de contraintes s: 


r=k—Ss; 


3) trouver dans la table 4 à partir de r et 4? la probabilité pour une 
variable répartie suivant la loi du y* à r degrés de liberté d'être supé- 
rieure à une valeur donnée du x*. Si cette probabilité est assez petite 
l'hypothèse est rejette comme non vraisemblable Si cette probabilité 
est relativement grande on peut adopter que l'hypothèse ne contre- 
dit pas les données expérimentales. 

Il est difficile de dire combien la probabilité p doit être petite 
pour qu'il y ait lieu de rejeter et de modifier l’hypothèse ; les raison- 


10— 2823 
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nements mathématiques ne permettent pas de répondre à cette ques- 
tion, tout comme il est difficile de dire quelle doit être la valeur de la 
probabilité d’un événement pour que celui-ci soit pratiquement impos- 
sible. Dans la pratique, si p est inférieure à 0,1 il y a lieu de véri- 
fier l'expérience, de la refaire si possible et si les écarts importants 
persistent, de rechercher une loi de répartition plus convenable pour 
décrire les données expérimentales en question. 

11 faut remarquer que rares sont les cas où le critère du 4° (ou tout 
autre critère de conformité) permet de réfuter l'hypothèse avancée 
H et de la rejeter comme non conforme aux données expérimentales ; 
si au contraire la probabilité p est grande, ceci ne peut en aucun cas 
être considéré comme une preuve irréfutable de la vraisemblance de 
l'hypothèse H, mais montre seulement que l'hypothèse ne contredit 
pas les données expérimentales. 

À première vue on pourrait croire que plus la probabilité p est 
grande, meilleure est la conformité des répartitions théorique et 
statistique et plus fondé est le choix de la fonction F (x) en tant que 
loi de répartition de X. En fait il n’en est rien. Supposons par exem- 
ple qu'en estimant la conformité des répartitions théorique et statis- 
tique par le critère du ° on ait obtenu p = 0,99. Ceci signifie qu'a- 
vec une probabilité le à 0,99, pour le nombre d'expériences effec- 
tuées, les écarts dus au hasard devraient être plus importants que 
ceux qui ont été observés. Mais les expériences ont fourni des écarts 
peu importants, trop petits pour que l’on puisse les considérer 
comme vraisemblables. Il semble plus raisonnable d'adopter qu'une 
coïncidence aussi bonne des répartitions théorique et statistique n'est 
pas due au hasard mais s'explique par l'arbitraire dans l’enregistre- 
ment et le traitement des données expérimentales (par exemple, par 
une «€ correction » des données expérimentales quand certains résul- 
tats sont rejetés à tort ou modifiés arbitrairement). 

Il est évident que ces raisonnements ne sont vrais que si le nom- 
bre d’expériences nr est suffisamment important (de l’ordre de plu- 
sieurs centaines) et lorsqu'il est raisonnable d'appliquer un critère 
basé sur la répartition limite de la mesure de non-conformité pour 
n — oo. Notons que pour pouvoir utiliser le critère du #° il faut que 
non seulement le nombre d'expériences x soit important, mais éga- 
lement le nombre d'observations m;, dans chaque intervalle. Prati- 
quement il est conseillé d'avoir au moins 5-10 observations 
par intervalle. Si dans certains intervalles le nombre d'observa- 
tions est assez petit (1 ou 2) il y a lieu de réunir plusieurs intervalles. 


Exemple 1. Vérifier la conformité des répartitions théorique et statis- 


tique pour l'exemple 1 du 8 7.5 (pages 129, 138). | 
Solution. En utilisant la loi de répartition théorique normale de 


paramètres 
m == 0,168; o = 1 448 
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on trouve les probabilités de tomber dans chaque {-ème intervalle à l’aide de 
la formule: 
ee Ttsi— mn _ é TZ, -—m 
pe=®* | o } œ* ( o }: 


Où z1, zyas Sont les limites de l’i-ème intervalle. 
On dresse ensuite le tableau comparatif des nombres m1 et des valeurs 
correspondantes np; (nr — 500): 


Ti [—#—3|—-3—-2)-2-1|—-10 | 0; 1 | 4 2 | 23 | 3; 4 


m | 6 25 120 | 88 | 8 10 


npi 6,2 26,2 71,2 10,5 


122,2 | 131,8 


90,5 | 38,2 


Fa on calcule la valeur de la mesure de non-conformité par la formu- 
e (7.6.4): 


8 
2— (mi np) _; 9,4. 
x 2 npi è 


On trouve alors le nombre de degrés de liberté comme le nombre d’interval- 
les moins le nombre de contraintes s (ici s = 3): 


r=8—3—5. 
Dans la table 4 de l’annexe on trouve pour r = 5: 
pour x? = 3,00 p = 0,70; 
pour #? = 4,35 p = 0,50. 

Par conséquent la probabilité cherchée p pour y? = 3,94 est approxima- 
tivement égale à 0,56. Cette probabilité n'est pas petite; on peut donc considérer 
vraisemblable l'hypothèse selon laquelle la variable X suit une loi normale. 

Exemple 2. Vérifier la conformité des répartitions théorique et statis- 
tique pour les conditions de l'exemple 2 du $ 7.5 (page 139). 

Solution. On calcule les valeurs p; comme les probabilités pour une 
variable aléatoire uniformément répartie sur le segment (23,6: 96.9) de se 


trouver dans les intervalles (20; 30). (30; 40), etc. On dresse alors le tableau 
comparatif des valeurs m, et np, (n — 400): 


Ti | 20; 30 | 30; 40 | 405 50 | 50; 60 | 60; 70 | 70; 80 | 80; 90 90: 100 


mi 


21 je | s [ss |s a | 


npi 


34,9 | 94,6 


54,6 | 54,6 | 94,6 | 94,6 | 94,6 | 38,0 


La formule (7.6.4) donne #2: 


Fes (ri 


(mi=np) op 9 
np! . 
{om 


10° 
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Le nombre de degrés de liberté est: 
r=8—3—=S5. 
La table 4 de l'annexe donne pour #? = 20,5 et r = 5: 
p = 0,001. 


Par conséquent, l'écart observé entre les répartitions théorique et sta- 
tistique ne pourrait être attribué au hasard qu'avec une probabilité p = 0,001. 
Cette probabilité étant très petite, il y a lieu d'admettre que les données expé- 
penis ne confirment pas l'hypothèse selon laquelle X suit une loi de densité 
uniforme. 


En plus du critère du #*, d’autres critères sont couramment utili- 
sés. Nous allons nous arrêter sur le critère de Kolmogorov. 

A. Kolmogorov a pris pour mesure de non-conformité des répar- 
titions théorique et statistique la valeur maximale du module de la 
différence entre la fonction de répartition statistique F* (x) et la 
fonction de répartition théorique correspondante, soit : 


D = max|F* (x) — F(2)1. 


Cette mesure de non-conformité est particulièrement simple à cal- 
culer; de plus assez simple est sa fonction de répartition. A. Kol- 
mogorov a montré que, quelle que soit la fonction de répartition 
F (x) d’une variable aléatoire continue X, lorsque le nombre d'obser- 
vations indépendantes 7 augmente, la probabilité de l'inégalité 


DV nr >À 
tend vers 


P()=1— Ÿ (—1)e-2n, (7.6.5) 
Rex — 00 


Les valeurs de la probabilité P (À) calculées par la formule (7.6.5) 
sont rassemblées dans le tableau 7.6.1. 


& Tableau 7.6.1 
à | PQ) | à P() | à PQ) 
0,0 1,000 0,7 0,711 1,4 0,040 
0:1 1 :000 0:8 0.544 1.5 0022 
0.2 1.000 0.9 0393 1.6 0.012 
0.3 1 000 10 02270 117 0006 
0.4 0997 11 0178 18 0003 
0:5 0.964 12 0,112 19 0002 
0.6 0 864 | 113 0! 2°0 0.001 


Le critère de Kolmogorov doit être utilisé comme suit: on cons- 
truit la fonction de répartition statistique F * (x) et la courbe de 
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répartition théorique F (x) et l’on détermine la quantité Dcommele 
maximum du module de la différence des deux courbes (fig. 7.6.2). 
Puis on calcule la grandeur 


1i=DVn 


et dans le tableau 7.6.1 on trouve la probabilité P (4). C’est la proba- 
bilité pour que, si X est vraiment répartie suivant la loi F (x), l'écart 
maximal entre F* (x) et F (x) dû aux facteurs aléatoires soit non 


Fig. 7.6.2 


inférieur à la valeur observée. Si la probabilité P (À) est petite, l'hy- 
pothèse doit être rejetée comme non vraisemblable; lorsque P (À) 
est assez grande on peut considérer qu'elle est compatible avec les 
données expérimentales. 

Le critère de Kolmogorov a l’avantage d'être bien plus simple que 
celui du #?; c'est pour cela qu'il est souvent utilisé dans les applica- 
tions pratiques. Il faut cependant noter que ce critère ne peut s’appli- 
quer que si la répartition hypothétique F (x) est donnée d'avance à 
partir de considérations théoriques, c'est-à-dire lorsqu'on connaît 
non seulement la forme de la fonction F (x) mais également tous ses 
paramètres. C’est un cas assez rare dans la pratique. Généralement 
des considérations théoriques donnent seulement la forme de la fonc- 
tion F (x) alors que les paramètres numériques se calculent à partir 
des données statistiques. Pour le critère du y? on en tient compte en 
diminuant le nombre de degrés de liberté de la répartition du #°. 
Le critère de Kolmogorov ne prévoit pas cette éventualité. Si l’on 
veut utiliser ce critère dans le cas où les paramètres de la répartition 
théorique sont calculés à partir des données statistiques, il donne des 
valeurs nettement exagérées de la probabilité P (À), de sorte que dans 
certains cas on risque d'adopter comme vraisemblable une hypothè- 
se qui en réalité nest pas conforme aux données expérimentales. 


CHAPITRE 8 


SYSTÈMES DE VARIABLES ALÉATOIRES 


8.1. Notion de système de variables aléatoires 


Dans les applications pratiques de la théorie des probabilités 
on rencontre souvent des problèmes dans lesquels les résultats des 
expériences se trouvent décrits non pas par une mais par deux ou plus 
variables aléatoires formant un système ou un ensemble. Par exemple, 
le point d'impact d'un obus est déterminé non pas par une seule varia- 
ble aléatoire, mais par deux: son abscisse et son ordonnée, lesquelles 
peuvent être considérées comme un système de deux variables aléa- 
toires. De même le point d'éclatement d'un obus à distance est 
déterminé par un ensemble de trois variables aléatoires. Lors du tir 
d'ensemble de n coups les coordonnées des points d'impact sur un plan 
peuvent être considérées comme un ensemble de 2n variables 
aléatoires. L'éclatement d'un obus produit des éclats qui sont 
caractérisés par plusieurs variables aléatoires; citons, par exemple 
le poids, les dimensions, la vitesse initiale, la direction de vol, etc. 
Nous désignerons par (X, Y,..., W) le système des variables 
aléatoires X. Y, 

Les propriétés d'un système de plusieurs variables aléatoires ne 
sont pas uniquement celles des composantes: il faut de plus tenir 
compte de leur interdépendance. 

Lors de l’étude des questions liées aux systèmes de variables aléa- 
toires, il est commode d'utiliser l'interprétation géométrique des 
systèmes. Par exemple, un système de deux variables aléatoires 
(X, Y) peut être représenté par un point aléatoire dans le plan de coor- 
données X et Y (fig. 8.1.1). D'une manière analogue un systè- 
me de trois variables aléatoires peut être figuré par un point aléa- 
toire dans un espace tridimensionnel. Plus généralement, on parle 
d'un système de x variables aléatoires comme d’un point aléatoire 
dans un espace à r dimensions. Bien que cette interprétation ne soit 
pas très figurative, elle est assez commode et permet de généraliser 
la terminologie et de simplifier les notations. 

À côté de l’image du point aléatoire on utilise pour l’interpréta- 
tion géométrique d'un système de variables aléatoires un vecteur 
aléatoire. Un système de deux. variables aléatoires est considéré com- 
me un vecteur aléatoire dans le plan rOy dont les composantes suivant 
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les axes sont des variables aléatoires X, Y (fig. 8.1.2). Un système 
de trois variables aléatoires est représenté par un vecteur aléatoire 
dans un espace tridimensionnel, un système de nr variables aléatoires 
par un vecteur aléatoire dans un espace à z dimensions. La théorie 
des systèmes de variables aléatoires devient alors la théorie des vec- 
leurs aléaioires. 

Dans ce cours nous utiliserons l’une ou l’autre de ces interpré- 
tations suivant le problème étudié. 


Fig. 8.1.1 Fig. 8.1.2 


Lors de l'étude des systèmes de variables aléatoires nous envisa- 
gerons tant les caractéristiques probabilistes complètes, c’est-à-dire 
les lois de répartition, que les caractéristiques incomplètes, c'est-à- 
dire les caractéristiques numériques. 

Nous allons commencer notre exposé par le cas simple d’un sys- 
tème de deux variables aléatoires. 


8.2. Fonction de répartition d'un système 
de deux variables aléatoires 


On appelle fonction de répartition d'un système de deux varia- 
bbles aléatoires (X, Y) la probabilité de vérification simultanée des 
deux inégalités X << x et Y << y: 


F (x, y) = P((X < x) (Y < y)). (8.2.1) 


En interprétant le système comme un point aléatoire, on voit que 
la fonction de répartition F (x, y) n’est rien d'autre que la probabi- 
lité pour le point aléatoire (X, Y) de se trouver dans le quadrant 
infini de sommet au point (x, y), situé à gauche et en bas de celui-ci 
(fig. 8.2.1). Dans cette même interprétation la fonction de répartition 
de la variable aléatoire X seule, que nous désignerons par F; (x), 
est la probabilité pour le point aléatoire de se trouver dans le demi- 
plan limité à droite par l’abscisse x (fig. 8.2.2) ;: de même la fonction 
de répartition F: (y) de Y est la probabilité pour le point aléatoire de 
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se trouver dans le demi-plan limité en haut par l’ordonnée y 
(fig. 8.2.3). 

Dans le $ 5.2 nous avons mentionné les propriétés essentielles de 
la fonction de répartition F (x) d'une variable aléatoire unique. Nous 
allons formuler les propriétés analogues de la fonction de répartition 


us | ” 
7 


Fig. 8.2.4 Fig. 8.2.2 


d'un système de variables aléatoires. A cet effet revenons à l'inter- 
prétation géométrique pour mieux illustrer ces propriétés. 

1. La fonction de répartition F (x, y) est une fonction non décrois- 
sante des deux Ur c'est-à-dire 


pour T2 > Zi F (z2, y) > >F (z1, y); 
pour y >y1 F(x y) >Fi(z, y). 


L'interprétation géométrique de la 
fonction de répartition F (x) en tant 


que probabilité pour le point (X, Y) 
de se trouver dans le quadrant de 
sommet (x, y) (fig. 8.2.1) permet faci- 


lement de s’en rendre compte. En effet, 
en augmentant x (par déplacement de 
Fig. 8.2.3 la limite droite du quadrant à droite) 
ou en augmentant y (par déplacement 
de la limite supérieure vers le haut) on ne peut diminuer la probabi- 
lité de tomber dans ce quadrant. 
2. Partout à — © la fonction de répartition est égale à zéro: 


F (x, — oo) = F (— oo, y) = F (— oo, —0co) = 0. 
Cette propriété apparaît lorsqu'on déplace indéfiniment à gauche 


la limite droite du quadrant (z —> —c) ou vers le bas sa limite supé- 
rieure (y —> — o), ou en effectuant cette opération simultanément 
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pour les deux limites ; la probabilité de tomber dans le quadrant tend 
alors vers zéro. 

3. Lorsque l’un des arguments est égal à + co, la fonction de 
répartition d'un système devient une fonction de répartition corres- 
pondant à l’autre argument: 


F (x, + oo) = Fi (x), F (+ 00, y) = Fa (y), 


où F;, (x), F2 (y) sont respectivement les fonctions de répartition des 
variables aléatoires X et Y. 

On peut facilement s'en rendre compte en faisant z —> + oo, 
Où y —> + oc ; à la limite le quadrant devient un demi-plan, la pro- 


Fig. 8.2.4 Fig. 8.2.5 


babilité de tomber dans ce demi-plan est donnée par la fonction de 
répartition de la variable respective. 

4. Si les deux arguments sont égaux à + oo, la fonction de répar- 
tition du système est égale à l'unité: 

F (+ ©, + oo) = 1. 

En effet, pour z—>—+ oo, y —>—+ oo le quadrant de sommet 
(z, y) devient à la limite le plan z0y, et le point s'y trouve certaine- 
ment. 

Lors de l'étude des lois de répartition des variables aléatoires 
indépendantes (chapitre 5) nous avons trouvé l'expression de la pro- 
babilité pour la variable aléatoire de se trouver dans l'intervalle 
donné. Nous avons exprimé cette probabilité tant à l’aide de la fonc- 
tion de répartition qu'à l’aide de la densité de probabilité. 

D'une manière analogue pour un système de deux variables aléa- 
toires on peut trouver la probabilité pour le point aléatoire (X, Y) 
de se trouver dans un domaine donné D du plan zOy (fig. 8.2.4). 

Convenons de désigner par le symbole (X, Y) € D l'événement 
consistant en ce que le point aléatoire (X, Ÿ) se trouve dans le do- 
maine D. 

La probabilité de cet événement s’exprime le plus simplemént 
lorsque le domaine est un rectangle dont les côtés sont parallèles aux 
axes de coordonnées. 
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Exprimons à l’aide de la fonction de répartition du système la 
probabilité pour le point aléatoire (X, Y) de se trouver dans le rectan- 
gle R, limité par les abscisses &æ et B et les ordonnées y et Ô 
(fig. 8.2.5). 

Il importe d'établir d'avance où rapporter les limites du rectan- 
gle. Tout comme nous l’avons fait dans le cas d’une variable aléatoire 
unique, nous considérons comme appartenantes au rectangle R sa 
limite inférieure et celle de gauche, sans y inclure ses limites supé- 
rieure et de droite *). Dans ce cas l'événement (X, Y) & R est 

équivalent au produit des deux 
4 événements a< X<Bety< 
Le , < Y < 6. Exprimons la proba- 


7” bilité de cet événement à l’aide 

N de la fonction de répartition du 
système. À cet effet considérons 

7 dans le plan zOy quatre qua- 


22 Le (4) drants infinis dont les sommets se 
ÈEe ; IL trouvent aux points (B, ô) ; (œ, ô) ; 
. ee 1 LEE LS : 9 9 9 L 
é. BR LC z (B, yet (a, y) (fig. 8.2.6). 

D TO SLR La probabilité de tomber dans 
SNL STILL ILE le rectangle À est de toute évi- 


dence égale à la probabilité de 

Fig. 8.2.6 tomber dans le quadrant (B, 6) 

moins la probabilité de tomber 

dans le quadrant (œ, 6) moins la 

probabilité de tomber dans le quadrant (f, y) plus la probabilité de 

tomber dans le quadrant (œ, y) (car nous avons deux fois retranché 

la probabilité de tomber dans ce dernier quadrant). On trouve ainsi 

une formule donnant la probabilité de tomber dans le rectangle 
exprimée à l’aide de la fonction de répartition du système: 


P(X  YMCR)=F(B, ê) —F(a, 5) —F(B, y + F (« y) 
(8.2.2) 
Dans la suite, après avoir introduit la notion de densité de 
probabilité d'un système nous démontrerons la formule de la 


probabilité pour un point aléatoire de se trouver dans un domaine 
de forme arbitraire. 


8.3. Densité de probabilité d’un système 
de deux variables aléatoires 


La fonction de répartition, introduite dans le paragraphe précé- 
dent en tant que caractéristique complète d’un système existe pour 
des systèmes à variables aléatoires tant discontinues que continues. 


*) Sur la figure 8.2.5 les limites incluses dans le rectangle sont données 
en trait gras. 
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Les systèmes de variables aléatoires continues jouent un rôle particu- 
lièrement important dans les applications pratiques. Les distribu- 
tions des systèmes de variables aléatoires continues sont généralement 
caractérisées non pas par leur fonction de répartition mais par leur 
densité de probabilité. 

Lorsque nous avons introduit la no- 
tion de densité de probabilité pour une 
seule variable aléatoire, nous l'avons 
définie comme la limite du rapport de 
la probabilité pour cette variable de se 
trouver dans un petit intervalle à la lon- 
gueur de cet intervalle lorsque celui-ci 
diminue indéfiniment. D'une manière ana- 
logue on peut définir la densité de pro- 
babilité d'un système de deux variables 
aléatoires. 

Soit un système de deux variables 
aléatoires continues (X, Y) interprété Fig. 8.5.1 
comme un point aléatoire dans le plan 
zOy. Considérons dans ce plan un petit rectangle R, dont les côtés 
sont Az et Ay avec un sommet au point de coordonnées (x, y) 
(fig. 8.3.1). La probabilité de tomber dans ce rectangle en vertu de 
la formule (8.2.2) est 


P((X, Y)S Ra) = F(z+ Az, y+ Ay) — F(z+ Az, y) — 
— F2, y + Ay)+ F(x y) 


Divisons la probabilité de tomber dans le rectangle R, par l'aire 
de ce rectangle et passons à la limite pour Az —+ 0 et Ay —+ 0: 


INVVVV6V,S”S‘SSES 


& 
NQ 


INVIVIIIKKK 


&x—0 Azây 
ày—0 
= Jim Er y +) —F (Has, y)—P(G, y+ay)+E (y) (8.3.1) 
Ax—0 Az Ay 
ôy—0 


Supposons la fonction F' (x, y) non seulement continue mais 
également dérivable; le second membre de la formule (8.3.1) est alors 
la dérivée partielle seconde mixte de la fonction F (x, y) par rapport 
à zet y. Désignons cette dérivée par f (x, y): 


dF(x,t 
FD = ET = Faye, v). (8.3.2) 


La fonction f (x, y) est la densité de probabilité du système. 

Ainsi la densité de probabilité d’un système est la limite du rap- 
port de la probabilité de tomber dans un petit rectangle à l’aire de 
ce rectangle, lorsque ses deux dimensions tendent vers zéro ; elle peut 
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s'exprimer comme la dérivée partielle seconde mixte de la fonction 
de répartition du système par rapport aux deux arguments. 

Dans l'interprétation + mécanistique » de la distribution d’un 
système en tant que répartition d'une masse unité dans le plan 
zOy, la fonction f (z, y) est la densité de probabilité de la masse au 
point (x, y). 

Du point de vue géométrique la fonction f (x, y) peut être une 
certaine surface (fig. 8.3.2). Cette surface est analogue à la courbe de 
répartition d'une variable aléatoire et s'appelle surface de répartition. 


f(z,y) R 

d 
IIS 
dé Z 
SN 7 
PASS 
z L 

À_, 
Z 
y 

Fig. 8.3.2 Fig. 8.3.3 


En coupant la surface de répartition f (x, y) par un plan parallèle 
au plan xOy et en projetant la section obtenue sur le plan zOy on 
obtient une courbe dont la densité est constante en tous les points. 
Ces courbes sont appelées courbes d'égale densité. Les courbes d'égale 
densité sont de toute évidence des horizontales de la surface de répar- 
tition. Il est souvent commode de donner une répartition par une 
famille de courbes d'égale densité. 

Lorsque nous avons étudié la densité de probabilité f (x) d'une 
seule variable aléatoire nous avons introduit la notion d’e élément de 
probabilité » f (x) dr. C’est la probabilité pour la variable aléatoire 
X de se trouver dans l'intervalle élémentaire dr adjacent au point zx. 
D'une manière analogue on peut introduire la notion d'« élément 
de probabilité » pour un système de variables aléatoires. Dans ce cas 
l'élément de probabilité est donné par l'expression; 


f (x, y) dx dy. 


Il est évident que l’élément de probabilité n'est rien d'autre que 
la probabilité de tomber dans le rectangle élémentaire de côtés dz, 
dy adjacent au point (x, y) (fig. 8.3.3). 

Cette probabilité se mesure par le volume du parallélépipède 
élémentaire ayant pour base le rectangle élémentaire dx dy et limité 
supérieurement.par la surface f (x, y) (fig. 8.3.4). 
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En utilisant la notion d'élément de probabilité on peut trouver 
l'expression de la probabilité pour un point aléatoire de se trouver 
dans un domaine quelconque D. Pour obtenir cette probabilité il 
y a évidemment lieu de prendre la somme (l'intégrale) des éléments de 
probabilité sur tout le domaine D: 


P((X,Y)= D)-- ff f(x. y) dr dy. (8.3.2) 
(D) 


Du point de vue géométrique, la probabilité de tomber dans le do- 
maine D est le volume du cylindre C limité en haut par la surface 
de répartition et dont la base est le domaine D (fig. 8.3.5). 


Fig. 8.3.4 


De la formule générale (8.3.3) on peut déduire celle concernant le 


rectangle À limité par les abscisses & et B et les ordonnées y et 6 
(fig. 8.2.5): 


ps 
P((X, Y)cR)=— | | f(x, y)dr dy. (8.3.4) 
œ Y 


Nous allons utiliser la formule (8.3.4) pour exprimer la fonction 
de répartition F (x, y) d'un système en fonction de la densité de pro- 
babilité f (x, y). La fonction de répartition F (x, y) est la probabilité 
de tomber dans un quadrant infini; on peut se représenter ce dernier 
comme le rectangle limité par les abscisses — oo et ret les ordonnées 
— © et y. En vertu de la formule (8.3.4) on a: 


x 


F(z, y)= | | f(x. y)dz dy. (8.3.5) 
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Il est facile de voir que la densité de probabilité est douée des 
propriétés suivantes: 
1. La densité de probabilité d’un système est une fonction non 


négative: 
f(&, y) 20. 


Ceci est évident car la densité de probabilité est la limite du rap- 
port de deux grandeurs non négatives: de la probabilité de tomber 
dans un rectangle et de l’aire de ce rectangle; par conséquent elle ne 
peut être négative. 

2. L'intégrale double dans des limites infinies de la densité de 
probabilité du système est égale à l'unité: 


( f(x, y) dx dy =1. (8.3.6) 


En effet l’intégrale (8.3.6) n'est rien d'autre que la probabilité de 
tomber dans le plan zOy entier, c'est-à-dire la probabilité d'un évé- 
nement certain. 

Du point de vue géométrique ceci signifie que le volume total 
d’un corps limité par la surface de répartition et le plan zOy est égal 
à l'unité. 

Exemple 1. Soit un système de deux variables aléatoires (X, Y) 
suivant une loi de répartition de densité de probabilité 

1 
IEEE (0) 
Trouver la fonction de répartition F (z, y). Trouver 
la probabilité pour le point aléatoire (X, Y) de se 
trouver dans le rectangle R (fig. 8.3.6). 


Solution. La fonction de répartition 
F (x, y) est donnée par la formule (8.3.5): 


1 (drag | 
FEN=-z J las” 


Fig. 8.3.6 


1 
= (= ere tgrz+— 5) (<are gy+—  )- 
La probabilité de tomber dans le dr KR est donnée par la formule (8.3.4): 


1 


_ ui 


ï ET ri 1+y2 — 16: 


Exemple 2. La surface de oo d'un système (X,. Ÿ) est un cône 
circulaire droit, ayant pour base un cercle de rayon R de centre à l’origine des 
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coordonnées. Trouver l'expression de la densité de probabilité. Trouver la 
pros ASIA pour que le point aléatoire (x, y) se trouve à l’intérieur d'un cercle C 
e rayon a, a R, (fig. 8.3.7). 


f(z,g) 


f(z,4) 


Fig. 8.3.7 Fig. 8.3.8 


Solution. Dans les notations de la figure 8.3.8 l'expression de la den- 
sité de probabilité à l’intérieur du cercle C s'écrit: 


h 
fa pn=(R—-Vr+ y). 
où À cst la hauteur du cône. On choisit À de telle sorte que le volume du cône 
soit égal à l'unité, soit = nA°%k = 1, d'où 
3 
RSR 
et 


Le ne (R- VEN). 


La probabilité de tomber à l'intérieur du cercle C est donnée par la for- 
mule (8.3.4): 


PAXNC= | [rte y dr ày. (8.3 7) 
(C) 


Pour calculer l'intégrale (8.3.7) il est commode de passer aux coordonnées polai- 
res r. ®: | 


a 2x 
P((X, rco=\ | _. (R—7r)rdr dp= 
0 0 


= (R—r)rdr=3 (+) -2 (+). 
0 
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.... 8.4. Lois de répartition des variables 
d'un système. Lois de répartition conditionnelles 


Connaissant la loi de répartition d'un système de deux variables 
aléatoires on peut toujours trouver celle des composantes. Dans le 
paragraphe 8.2 nous avons exprimé les fonctions de répartition des 
variables d'un système à l’aide de la fonction de répartition du systè- 
me, plus exactement nous avons montré que: 


Fi (z) = F (x, ©); F2(y) = F (oo, y). (8.4.1) 


Nous allons maintenant exprimer la densité de probabilité de 
chacune des variables d’un système en fonction de la densité de proba- 
bilité du système. En utilisant la formule (8.3.5) donnant la fonction 
de répartition en fonction de la densité de probabilité on a: 

Fi(a)=F(e œ)= | | f(x, y)arày, 
d’où en dérivant par rapport à x on obtient l'expression de la densité 
de probabilité de X: 


h(=F(2)= | f( né. (8.4.2) 


D'une manière analogue on a: 
h=F = | f( pas. (8.4.3) 


Ainsi, pour obtenir la densité de probabilité de l’une des variables 
du système, il y a lieu d'intégrer la densité de probabilité du système 
dans des limites infinies sur l’argument correspondant à l’autre va- 
riable. 

Les formules (8.4.1), (8.4.2) et (8.4.3) permettent, connaissant la 
loi de répartition du système (sa fonction de répartition ou sa densité 
de probabilité) de trouver la loi de répartition des variables faisant 
partie du système. On peut alors tout naturellement se poser le pro- 
blème inverse qui consiste, connaissant les lois de répartition des 
variables d'un système, à trouver la loi de répartition du système. 
Il se trouve que dans le cas général c'est impossible : la connaissance 
des lois de répartition des variables du système ne suffit pas tou- 
jours à trouver la loi de répartition du système. Pour caractériser 
complètement un système il faut encore connaître la relation existant 
entre les variables du système. Cette relation peut être exprimée 
à l’aide des Lois de répartition conditionnelles. 

On appelle loi de répartition conditionnelle de la variable X 
du système (X, Ÿ) la loi de répartition calculée sous la condition 
que l’autre variable Ÿ a pris une certaine valeur y. 
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On peut donner une loi de répartition conditionnelle tant par la 
fonction de répartition que par la densité. On désigne par F (z|y) 
la fonction de répartition conditionnelle, et par f (z|y) la densité 
de probabilité conditionnelle. Vu le grand intérêt pratique que pré- 
sentent les systèmes de variables continues, nous nous limitons dans 
ce cours à l’étude des lois conditionnelles données pour des densités 
de probabilité. Pour préciser la notion de loi de répartition con- 
ditionnelle nous allons étudier un exemple. Un système est formé de 
variables aléatoires L et Q qui sont la grandeur et le poids d'une 
race d'animaux. Supposons que nous 
nous intéressions à la grandeur L Ÿ 
indépendamment du poids: c'est une 
variable aléatoire répartie suivant 
une certaine loi de densité de proba- 
bilité f, (2). Comme toujours, on peut 
étudier cette loi de probabilité en 
envisageant tous les animaux sans 
exception, enregistrant la grandeur de 
chacun d'eux et en traitant les données 
obtenues tout comme dans le cas d’une 
seule variable aléatoire. La loi f, (D) est 
la loi de répartition inconditionnelle de 
la grandeur des animaux. Cependant Fig. 8.4. 
on peut également s'intéresser à la loi 
de répartition de grandeur des animaux d'un certain poids, par 
exemple de 2 kg. Pour trouver cette loi nous allons mesurer la 
grandeur non pas de tous les animaux, mais seulement de ceux dont 
le poids est voisin de 2 kg ; nous obtiendrons alors la loi de répartition 
conditionnelle de la grandeur des animaux f (1|q) pour qg = 2. Cette 
loi conditionnelle diffère en général de la loi inconditionnelle f; (L): 
il est évident que .les animaux plus lourds seront en moyenne 
plus grands, par conséquent, la loi de répartition conditionnelle 
de grandeur d’un animal f (2|q) dépend de la valeur donnée de g. 

Connaissant la loi de répartition de l’une des variables du système 
et la loi de répartition conditionnelle de la seconde on peut déter- 
miner la loi de répartition du système. Nous allons trouver la formule 
exprimant cette relation pour les variables aléatoires continues. 
A cet effet nous utiliserons la notion d'élément de probabilité. Scit 
le rectangle élémentaire R, de côtés dr et dy adjacent au point (zx, y) 
(fig. 8.4.1). La probabilité de tomber dans ce rectangle, donnée par 
l'élément de probabilité f (x, y) dr dy, est égale à la probabilité 
pour le point aléatoire (X, Y) de se trouver simultanément dans la 
bande élémentaire Z de base dx et dans la bande 77 de base dy: 


f(x, y) dr dy = P((X, Y) € Rd — 
= P(z<X<z+ dr) (y<Y < y+ dy)). 


dd = 


PSS SSII SSI SSII III S 


SISIII ITU | À 


PSS SSII IL. LISS SSI IS 


pb 


11 —2823 
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La probabilité du produit de ces deux événements est en vertu du 
théorème de multiplication des probabilités égale à la probabilité 
de tomber dans la bande élémentaire 7, multipliée par la probabilité 
conditionnelle de tomber dans la bande élémentaire ZZ, cette dernière 
probabilité calculée sous la condition que le premier événement ait 
été réalisé. A la limite cette condition équivaut à la condition 
X = zx; par conséquent: 


Î (x, y) dx dy = fi (x) dr f (y | x) dy, 
f(x y) = f(x) f wlz), (8.4.4) 


c'est-à-dire que la densité de probabilité d'un système de deux varia- 
bles est égale à la densité de probabilité de l’une d'elles multipliée 
par la densité de probabilité conditionnelle de l’autre, calculée sous 
la condition que la première ait une valeur donnée. 

La formule (8.4.4) est souvent appelée théorème de multiplication 
des lois de répartition. Ce théorème est équivalent à celui de multi- 
plication des probabilités pour les événements. 

Il est évident que la formule (8.4.4) peut prendre une autre forme 
si ce n'est pas la variable X mais Ÿ qui est donnée: 


f(x, y) =f2y) f(xly). (8.4.5) 


À partir des équations (8.4.4) et (8.4.5) on trouve les expressions des 
probabilités conditionnelles f (y]x) et f (z|y) en fonction des lois 


d'où : 


inconditionnelles : 
J Ga = | 
(8.4.6) 
_ 1 (z,y) 
[ED 
ou, compte tenu des formules (8.4.2) et (8.4.3), 
fyln=-120 ;) 
Î f(x, dy | 
dE (8.4.7) 
fely= En. 
Ÿ f(x, y)dz 


8.5. Variables aléatoires liées et indépendantes 


Lors de l’étude des systèmes de variables aléatoires il y a toujours 
lieu de tenir compte du degré et du caractère de leur dépendance mu- 
tuelle qui peut être plus ou moins prononcée, plus ou moinsimportante. 
Dans certains cas les variables aléatoires peuvent être si étroitement 
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liées que connaissant la valeur de l’une d'elles on peut déterminer 
exactement la valeur de l’autre. Dans l’autre cas limite les variables 
aléatoires sont si faiblement liées que l'on peut pratiquement les 
considérer comme indépendantes. 

La notion de variable aléatoire indépendante est l’une des notions 
fondamentales de la théorie des probabilités. 

La variable aléatoire Ÿ est dite indépendante de la variable aléa- 
toire X si la loi de répartition de Ÿ ne dépend pas de la valeur prise 

ar À. 

j Dans le cas continu, la condition d’indépendance des variables 
aléatoires X et Ÿ s'écrit: 


f(ylz) = f2 (y) 
quel que soit y. 
Au contraire, si Ÿ dépend de X on a: 


f(y1zx) # f2 (y). 


Nous allons montrer que la dépendance ou l'indépendance des varia- 
bles aléatoires est une propriété mutuelle, c'est-à-dire si } ne dépend 
pas de X, X ne dépend pas non plus de Y. 

En effet, supposons que Ÿ ne dépende pas de X: 


f(ylz) = f2 (y). (8.5.1) 
En vertu des formules (8.4.4) et (8.4.5) on a alors: 


fi (&) f(y1z) = f2 (y) f(zly), 


d'où, compte tenu de (8.5.1), 
f(zly) = f; (x), 
ce qu'il fallait démontrer. 

Comme les propriétés de dépendance et d'indépendance des 
variables aléatoires sont mutuelles, on peut donner une nouvelle 
définition des variables aléatoires indépendantes. 

Les variables aléatoires X et Y sont dites indépendantes si la lui 
de répartition de chacune d'elles ne dépend pas des valeurs prises par 
l'autre. Dans le cas contraire les variables aléatoires X et Y sont 
dites liées. 

Pour les variables aléatoires continues le théorème de multiplica- 
tion des lois de répartition s’écrit: 


f(z, y) = fi (x) f2 (y), (8.5.2) 


c'est-à-dire que la densité de probabilité d'un système de variables aléa- 
toires indépendantes est égale au produit des densités des variables faisant 
partie du système. 

La condition (8.5.2) peut être considérée comme la condition né- 
cessaire et suffisante d'indépendance des variables aléatoires. 


11° 
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Souvent la forme même de la fonction f (x, y) permet de voir 
que les variables X, Y sont indépendantes: si la densité de probabi- 
lité f (x, y) peut s’écrire comme le produit de deux fonctions dont 
l'une dépend seulement de x et l’autre seulement de y, les variables 
aléatoires sont indépendantes. 


Exemple. La densité de probabilité du système (X, Y) est de la forme: 
1 
PENSER Ye) 

Déterminer si les variables aléatoires X et Y sont liées ou non. 

Solution. En décomposant le dénominateur en produit de facteurs 
on a: 

1 1 
DETTE ET(E TL) 

Le fait que la fonction f (x. y) se décompose en un produit de deux fonctions 

dont l’une dépend seulement de z et l’autre seulement de y permet de conclure 


que les variables X et Y doivent être indépendantes. En effet, en vertu des 
formules (8.4.2) et (8.4.3) on a: 


f es C dy _ __1 _. 
ARTE) Î a(+y2 (+2) 
et d’une manière analogue: 

BU = — 

F9 at+)" 
d'où 

f (ze y) = fs (x) fa (y), 

ce qui signifie que X et Ÿ sont indépendantes. 


Le critère mentionné pour juger si des variables aléatoires sont 
liées ou non n'est applicable que si la loi de répartition du système 
est connue. Le plus souvent dans la pratique on ne connaît pas la loi 
du système (X, ŸY), mais seulement les lois des composantes, et l’on 
a toutes les raisons de penser qu'elles sont indépendantes. On peut 
alors écrire la densité de probabilité du système comme le produit 
des densités des composantes. 

Nous allons nous arrêter un peu plus en détail sur les notions fort 
importantes de « dépendance » ou d’'« indépendance» des variables 
aléatoires. 

La notion de « dépendance » de variables aléatoires utilisée en 
théorie des probabilités diffère quelque peu de la notion usuelle de 
« dépendance » des grandeurs employée en mathématiques. En effet, 
on entend habituellement par dépendance des grandeurs un seul type 
de dépendance, à savoir la dépendance totale, dite fonctionnelle. 
Deux grandeurs X et Y sont fonctionnellement dépendantes si connais- 
sant la valeur de l’une d'elles on peut trouver exactement la valeur 
de l’autre. 


8.5] VARIABLES ALÉATOIRES LIÉES ET INDÉPENDANTES 465 


En théorie des probabilités cette notion est comprise dans un sens 
plus général, on parle d’une dépendance probabiliste ou stochastique. 
Si deux variables Y et X sont liées par une relation probabiliste, 
connaissant la valeur de X on ne peut pas déterminer la valeur 
exacte de Ÿ, mais seulement donner sa loi de répartition qui dépend 
de la valeur de X. 

La dépendance probabiliste peut être plus ou moins forte; plus 
cette dépendance est forte, plus elle se rapproche d'une relation fonc- 
tionnelle. Ainsi, une relation fonctionnelle peut être considérée 
comme le cas limite de la dépendance probabiliste forte. L'autre cas 
limite est l'indépendance totale des variables aléatoires. Toutes les 
variétés de la dépendance probabiliste, de la plus forte à la plus 
faible, se trouvent entre ces deux cas limites. Les grandeurs physiques 
entre lesquelles nous voyons une relation fonctionnelle sont 
en réalité liées par une relation probabiliste bien étroite, c’est-à-dire 
que pour une valeur donnée de l’une de ces grandeurs l’autre varie 
dans des limites si étroites qu'on peut pratiquement la considérer 
comme une grandeur certaine. D'autre part, les grandeurs que nous 
considérons dans la pratique indépendantes, sont en réalité 
mutuellement liées, mais cette liaison est si faible qu'on peut la 
négliger. 

Dans la pratique on rencontre fréquemment des relations probabi- 
listes entre des variables aléatoires. Dire que les variables aléatoires 
X et Y sont liées par une relation probabiliste ne signifie pas que les 
variations de X entraînent des variations déterminées de Ÿ ; ceci 
signifie seulement que lorsque X varie, Ÿ tend également à varier 
(par exemple à croître ou décroître lorsque X croît). Cette tendance 
ne se manifeste qu'en moyenne, grossièrement, et peut ne pas tou- 
jours se réaliser. 

Considérons par exemple deux variables aléatoires X et Y qui 
sont la taille d’un homme pris au hasard et son poids. Il est évident 
qu'entre les variables X et Ÿ il y a une relation probabiliste, car dans 
le cas général les hommes plus grands sont plus lourds. On peut même 
trouver une formule empirique remplaçant cette relation probabiliste 
par une relation fonctionnelle. Citons en guise d'exemple la formule 
bien connue donnant la relation approchée entre la taille et le poids: 


Y (kg) = X (cm) — 100. 


Il est évident que les formules de ce genre ne sont pas exactes et 
n’expriment une relation qu'en moyenne, une tendance générale avec 
des écarts possibles dans chaque cas particulier. Considérons mainte- 
nant les deux variables aléatoires suivantes: la taille X d’un homme 
pris au hasard et son âge Z. Il est clair que pour des adultes les varia- 
bles X et Y sont pratiquement indépendantes; au contraire pour un 
enfant elles sont liées. 
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Nous allons encore donner quelques exemples de variables aléa-. 
toires plus ou moins liées entre elles. 

1. On prend au hasard une pierre dans un cailloutis. Le poids Q 
d’un caillou et sa dimension maximale Z sont des variables aléatoi- 
res, liées de toute évidence par une relation probabiliste forte. 

2. Des fusées sont lancées dans une région donnée de l’océan. 
AX est l'erreur longitudinale du point d'impact et AV l'erreur de 
vitesse de la fusée à la fin du vol. Les variables AX et AV sont de 
toute évidence liées, car l’erreur AŸ est l’une des causes principales 
de l'erreur longitudinale AX. 

3. Un avion en vol détermine sa hauteur au-dessus de la surface 
de la terre à l’aide d’un appareil barométrique. Considérons les deux 
variables aléatoires suivantes: AA, l’erreur de mesure de l'altitude 
et G, le poids du combustible restant dans le réservoir au moment de 
la mesure. Les variables AH et G sont pratiquement indépendantes. 

Dans le paragraphe suivant nous allons étudier certaines caracté- 
ristiques numériques des systèmes des variables aléatoires permettant 
d'estimer le degré de dépendance des variables. 


8.6. Caractéristiques numériques des systèmes 
de deux variables aléatoires. Covariance. 
Coefficient de corrélation 


Dans le chapitre 5 nous avons étudié les caractéristiques numéri- 
ques d’une variable aléatoire X, à savoir les moments initiaux et 
centrés de différents ordres. Deux de ces caractéristiques jouent un 
rôle particulièrement important, ce sont l'espérance mathématique 
m, et la variance D... 

On peut introduire des caractéristiques numériques semblables 
pour un système de deux variables aléatoires. 

On appelle moment initial d'ordre k, s du système (X, Y) l'espé- 
rance mathématique du produit de X* par Y‘: 


@n.s=MI{X"Y"]. (8.6.1) 


On appelle moment centré d'ordre k, s du système (X, Y) l’espé- 
rance mathématique du produit des puissances k et s des moments 
centrés correspondants, soit: 


Un. = M IX*Ÿ"], (8.6.2) 


où *— X — m,, Y — Y — m, 
Ecrivons les formules permetttant de calculer directement les 
moments. Pour les variables aléatoires discrètes on a: 


GR. s = > > Zi yjPus, (8.6.3) 
Un, s — 2 2 (zi — ms)" (Y— my)" Pi, (8.6.4) 
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où pi = P ((X = z:) (Y = y;)) est la probabilité pour que le systè- 
me (X, Ÿ) prenne la valeur (x, y;), la sommation s'étendant à toutes 
les valeurs possibles des variables X, Y. 

Pour les variables aléatoires continues on a: 


= | | 2\y*f (x, y) dx dy, (8.6.5) 


Un, s = { { (z— m.} (y— m,) f(x, y) dr dy, (8.6.6) 


où f (x, y) est la densité de probabilité du système. 

En plus des nombres # et s caractérisant l’ordre des moments des 
variables isolément, on considère encore l’ordre total k + s, égal 
à la somme des puissances de X et de Ÿ. Pour indiquer l’ordre du 
moment d'un système on donne son ordre total. Dans la pratique on 
utilise seulement les moments du premier et du second ordre. 

Les moments initiaux d'ordre un sont les espérances mathématiques 
bien connues des variables X et Y du système, soit: 


Mx = %,0= M [X'Y°]=M[X]; 
My =, =MIAXYI]=MI[Y]. 


L'ensemble des espérances mathématiques m., m, est la caractéristique 
de position du système. Du point de vue géométrique ce sont les coor- 
données du point moyen dans le plan autour duquel il y a dispersion 
du point (X, Y). 

En plus des moments initiaux d'ordre un, dans les applications 
pratiques on utilise encore les moments centrés deur du système. 
Deux de ces moments sont les variances des variables X et Y que nous 
connaissons déjà, soit: 


De=bo=MIXŸY = M [IX] = D{X], 
Dy= bo.2= M IXŸ]=MIŸ*)=DIY], 


caractérisant la dispersion du point aléatoire dans la direction des 
axes Oz et Oy. 

Le moment central mixte deux joue un rôle particulièrement impor- 
tant. C'est la quantité 


Hi: =M(XŸ)], 


donc l'espérance mathématique du produit des variables centrées. 
Vu son rôle important dans la théorie des systèmes de variables 
aléatoires, on lui donne une désignation particulière : 


K:y=MIXŸ]=MI(X—m,)(Y —m,)], (8.6.7) 
et on l'appelle covariance des variables aléatoires X, Y. 
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Pour les variables aléatoires discrètes la covariance est donnée 
par la formule: 


Kxy = D à (ri ms) (y; — my) pis, (8.6.8) 


et pour les variables continues par la formule: 
Kay= | (z—m)(y—m) f(x, vds dy. (8.6.9) 


Nous allons préciser le sens et le rôle de cette caractéristique. 

La covariance est une caractéristique du système décrivant, en 
plus de la dispersion des variables X et Y,leur liaison. Pour 
nous en rendre compte nous allons montrer que la covariance des va- 
riables aléatoires indépendantes est nulle. 

Nous démontrons cette proposition pour le cas continu *). Soient 
X, Y des variables continues, indépendantes, de densité de probabi- 
lité f (x, y). Dans le $ 8.5 nous avons démontré que pour des varia- 
bles indépendantes on a: 


f(x, y) = f1 (x) f2 (y), (8.6.10) 


OÙ f1 (x), f2 (y) sont les densités de probabilité des variables X et Y 
respectivement. | 

En substituant (8.6.10) dans (8.6.9) on voit que l’intégrale (8.6.9) 
devient un produit de deux intégrales, en effet : 


Kay= | (ms) f(z)dz | (y—m) fe(u) dy. 
L'intégrale _ _ 
Î (&— mL) fi (x) à 


n'est rien d'autre que le premier moment centré de X et donc est 
égale à zéro; le second facteur est nul pour la même raison ; par consé- 
quent, pour des variables aléatoires indépendantes on a A,, = 0 

Ainsi, si la covariance de deux variables aléatoires est différente 
de zéro c'est un indice montrant qu'elles sont liées. 

La formule (8.6.7) montre que la covariance caractérise non 
seulement la dépendance des variables aléatoires mais également leur 
dispersion. En effet si, par exemple, l’une des variables du système 
(X, Y) s’écarte peu de son espérance mathématique (variable presque 
certaine), la covariance sera petite même si les variables X, Y sont 
ét roitement liées entre elles. Alors pour caractériser seulement le lici- 


*) Pour les variables discrètes la démonstration est analogue. 
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son des variables X, Ÿ on passe du moment K,, à la grandeur sans 
dimension 
Kry . 

nr (8.6.11) 
OÙ Ox 0, Sont les écarts quadratiques moyens des variables X, Y. 
Cette caractéristique s'appelle coefficient de corrélation des variables 
X et Y. Il est évident que le coefficient de corrélation s’annule avec la 
covariance; par conséquent le coefficient de corrélation des variables 
aléatoires indépendantes est égal à zéro. 

On appelle non corrélées les variables aléatoires dont la covariance 
(donc également le coefficient de corrélation) est nulle. 

Nous allons voir maintenant si les notions de « non-corrélation » 
et d’e« indépendance» sont équivalentes. Nous avons démontré 
ci-dessus que deux variables aléatoires indé- 
pendantes sont toujours non corrélées. Il 
faut voir maintenant si l’assertion inverse 
selon laquelle deux variables non corrélées 
sont indépendantes est vraie. Il se trouve 
que non. On peut trouver des exemples de 
variables aléatoires non corrélées mais 
liées. La nullité du coefficient de corrélation 
des variables aléatoires est une condition 
nécessaire mais non suffisante de leur 
indépendance. L'indépendance des variables 
aléatoires entraîne leur non-corrélation, | 
l'inverse n'étant pas vrai, la non-corrélation Fig. 8.6.1 
n’entraînant pas l'indépendance. La condi- 
tion d’indépéndance des variables aléatoires est une condition plus 
rigoureuse que celle de non-corrélation. 

Nous allons voir ce qui vient d’être dit sur un exemple. Soit un 
système de variables aléatoires (X, Y) uniformément réparties à l’in- 
térieur d’un cercle C de rayon r et de centre à l'origine des coordon- 
nées (fig. 8.6.1). 

La densité de probabilité du système (X, Y) s'écrit: 


__fe pour + y <r, 
TES EE 


La condition ( f(x, y) dr dy = | | c dx dy = 1 donne c — 1/nr:. 


—00 C 

Il est facile de voir que dans cet exemple les variables sont dépen- 
dantes. En effet, il est immédiat que si par exemple X = 0, Ÿ peut, 
avec une même probabilité, prendre toutes les valeurs comprises entre 
—r et +r; mais si À = r, Ÿ ne peut prendre qu'une seule valeur 
égale à zéro; dans le cas général la gamme des valeurs possibles de Y 
dépend de la valeur de X. 
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Pour voir si ces variables sont corrélées, calculons leur covariance. 
En vertu de la symétrie des conditions du problème, m, = m, = 0 
et on a: 


K xy = [S zy f(x, y) dx dy = +; 1] zy dr dy.  (8.6.12) 


Pour calculer cette intégrale on divise le domaine d'intégration 
(cercle C) en quatre secteurs Ci, C2, Cs, Ci correspondant aux quatre 
quadrants. Dans les secteurs C; et C: la fonction sous l'intégrale est 
positive, dans les secteurs C, et C; elle est négative: de plus, les inté- 
grales dans tous ces secteurs sont égales en valeur absolue; par consé- 
quent l'intégrale (8.6.12) est nulle et les variables X, Y ne sont pas 
corrélées. 

On voit ainsi que des variables aléatoires non corrélées ne sont pas 
forcément indépendantes. 

Le coefficient de corrélation caractérise non pas une relation quel- 
conque mais seulement une relation dite linéaire. On dit que deux 
variables aléatoires sont liées par une relation probabiliste linéaire 
si lorsque l’une d'elles croît, l’autre accuse une tendance à croître 
(à décroître) suivant une loi linéaire. Cette tendance linéaire peut 
être plus ou moins prononcée et s'approcher plus ou moins d'une rela- 
tion fonctionnelle, c'est-à-dire d’une relation linéaire au sens strict. 
Le coefficient de corrélation indique à quel point la relation linéaire 
entre deux variables aléatoires est intime. Si les variables aléatoires 
X et Y sont liées par une relation fonctionnelle exacte 


Y = aX + b, 


on a rzy = + 1, le signe «+» ou «—» correspond au signe du coeffi- 
cient a. Dans le cas général, lorsque les variables X et Y sont liées par 
une relation probabiliste arbitraire, le coefficient de corrélation peut 
se trouver dans les limites: 


— 1 <rry L1°). 


Quand r,, > 0, la corrélation est dite positive, dans le cas r,, << 0 
elle est dite négative. Une corrélation positive signifie que lorsque 
l'une des variables croît, l’autre a également tendance à croître en 
moyenne; une corrélation négative signifie que lorsque l’une des 
variables croît, l’autre tend en moyenne à décroître. 

Dans l’exemple envisagé d’un système de deux variables aléatoi- 
res (X, Ÿ) uniformément réparties à l'intérieur d’un cercle, bien 
qu'entre À et Y il existe une relation, celle-ci n'est pas linéaire; 
lorsque X croît, seule la gamme des variations de Ÿ change, sa va- 
leur moyenne restant la même, donc X et Y sont non corrélées. 


*) Nous allons démontrer cette assertion plus loin, dans le 6 10.3, après 
l'introduction de certains théorèmes de la théorie des probabilités permettant 
de simplifier la démonstration. 


Fig. 8.6.2 Fig. 8.6.3 
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Nous allons donner quelques exemples de variables aléatoires 
à corrélation positive et négative. 

1. Le poids et la taille d’un homme ont une corrélation positive. 

2. Le temps de réglage d’un appareil avant sa mise en service et le 
temps de fonctionnement sans défaillance ont une corrélation positive 
(si, bien entendu, les pertes de temps sont rationnelles). Inversement, 
entre le temps de préparation et le nombre de défauts décelés lors du 
fonctionnement de l’appareil il y a une corrélation négative. 

3. Dans un tir par rafales, les coordonnées des points d'impact 
des différentes balles sont liées par une corrélation positive (car il y a 
des erreurs de visée communes à tous les coups). 

4. Deux coups sont tirés sur une cible l’un après l’autre; le point 
d'impact du premier coup est enregistré et une correction de visée 
est introduite proportionnelle à l’erreur du premier coup et de signe 
inverse. Les coordonnées des points d'impact du premier et du second 
coup seront dans ce cas liées par une corrélation négative. 

Si nous avons à notre disposition les résultats d’une série d’expé- 
riences effectuées sur un système de deux variables aléatoires (X, Y), 
nous pouvons juger grossièrement de l’existence d’une corrélation plus 
ou moins importante entre ces variables d’après le graphique où sont 
portés les points correspondant à tous les couples observés de leurs 
valeurs. Par exemple, si les points se disposent comme indiqué sur 
la figure 8.6.2 il y a une corrélation positive nette entre ces varia- 
bles. Cette corrélation positive est encore plus nette sur la figure 
8.6.3, où elle est voisine d’une relation fonctionnelle. Sur la figure 
8.6.4 on peut voir un cas d’une corrélation négative assez faible. 
Enfin sur la figure 8.6.5 on a représenté un cas de variables aléatoi- 
res non corrélées. Dans les applications pratiques, il est toujours bon 
de porter les couples observés sur un graphique pour se faire une idée 
qualitative du type de corrélation. 

Dans le chapitre 14 nous étudierons les méthodes de détermination 
des caractéristiques des systèmes de variables aléatoires à partir des 
données expérimentales. 


8.7. Système d'un nombre arbitraire 
de variables aléatoires 


Dans la pratique on rencontre souvent des systèmes composés 
de plus de deux variables aléatoires. On peut interpréter ces systè- 
mes comme des points aléatoires ou des vecteurs aléatoires dans l’es- 
pace de dimension respective. 

Citons d’abord quelques exemples. 

1. Le point d'explosion d’un projectile fusant dans l’espace est 
caractérisé par trois coordonnées cartésiennes (X, Y, Z) ou par trois 
coordonnées sphériques (R, ®, @). 
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2. L'ensemble de r7 mesures successives d’une grandeur variable 
X est un système de nr variables aléatoires (X1, X2, . . ., X). 

3. On tire une rafale de x coups. L'ensemble des coordonnées 
des » points d'impact dans le plan forme un système de 2n variables 
aléatoires (abscisses et ordonnées des points d'impact) : 


(X4, X2, 1 X n: Y1 Ya 7 Yn). 


4. La vitesse initiale d’un éclat est un vecteur aléatoire caracté- 
risé par trois grandeurs aléatoires: la valeur de la vitesse V, et les 
deux angles ® et 6 déterminant la direction de vol de l'éclat dans 
un système de coordonnées sphériques. 

Un système d’un nombre arbitraire de variables aléatoires est 
entièrement caractérisé par la loi de répartition du système pouvant 
être donnée par la fonction de répartition ou la densité de probabilité. 

On appelle fonction de répartition d’un système de n variables 
aléatoires (X:, X2, . .., X,) la probabilité pour que soient vérifiées 
simultanément n inégalités du type X, << x: 


F (zs, Toy c..) Zn) = P ((X: < Zi) (X2 < Z2) RS (Xn < Tn)). 
(8.7.1) 


On appelle densité de probabilité d'un système de n variables 
aléatoires continues la dérivée 7-ième partielle mixte de la fonction 
F (z1, Ze, - . «+, Zn) prise une fois par rapport à chaque argument: 


onF (ze, Zas Zn) 


(a T2, ce.) Tn) = Ox1072 ... Zn 


(8.7.2) 

Connaissant la loi de répartition du système, on peut trouver celle 
des composantes. La fonction de répartition de chacune des variables 
du système s'obtient en posant tous les autres arguments dans la 
fonction de répartition du système égaux à co: 


Fi (z:1) = F (x, ©, ..., oo). (8.7.3) 


Si (X,, X2, . - ., Xn) est un sous-système du système (X:, 
X2, + -., Xh), la fonction de répartition de ce sous-système est don- 
née par la formule: 


Fu. k (Ti L2, zx) =F(x;, To, ce. Thy O0, C0). (8.7.4) 


Pour obtenir la densité de probabilité de chacune des variables 
du système il y a lieu d’iutégrer la densité de probabilité du système 
dans des limites infinies par rapport à tous les autres arguments: 


f1 (21) = | …. Î f(Zis.T2s +, Zn) A2... dTn- (8.7.5) 
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La densité de probabilité du sous-système (X:, X2, ..., X,) 
issu du système (X:, X2, . .., X,) est égale à 


fase. (Zur Tes +. Th) = 


_ | f(Æis Toy ce. Zn) dThsy.. dtn. (8.7.6) 


On appelle loi de répartition conditionnelle du sous-système 
(X1, X2, . .-., X3) sa loi de répartition calculée sous la condition 
que les variables Xy+1, . . ., À, restantes aient pris les valeurs 
This © + +) Ln- 

La densité de probabilité conditionnelle est donnée par la formule : 


A ACT Z2s -..s Zn) 
Î(z, ss DR | ER 7) D RE ETPERRPEE TN (8.7.7) 


Les variables aléatoires (X1, X2, . .., X,) sont dites indépen- 
dantes si la loi de répartition de tout sous-système appartenant au 
système (X1, X2, -.-., Xh) ne dépend pas des valeurs prises par les 
autres variables du système. 

La densité de probabilité d’un système de variables aléatoires 
indépendantes est égale au produit des densités de toutes les variables 
du système : 


f (frs Las + +, En) = f1 (Zi)f2 (T2) + + + fn (Zn). (8.7.8) 


La probabilité pour le point aléatoire (X:, X2, ..., À,) de 
se trouver dans un domaine D de dimension nr s'exprime par l’in- 
tégrale à nr dimensions: 


P ((X, Xe, …, X)cD)=(...( (a To, +. Tn) dy dI +. dt 
(D) 
(8.7.9) 


La formule (8.7.9) est la formule de base pour calculer les probabi- 
lités des événements ne se ramenant pas au « schéma du tirage exhaus- 
tif ». En effet, si l'événement À nous intéressant ne se ramène pas 
au cas du « tirage exhaustif », sa probabilité ne peut pas être calculée 
directement. Si de plus il n’est pas possible de faire un nombre suffi- 
sant d'expériences semblables et de déterminer d'une manière 
approchée la probabilité de l'événement À d'après sa fréquence, on 
adopte le schéma de calcul suivant. On passe des événements aux 
variables aléatoires (le plus souvent continues) et l'on associe à l'évé- 
nement À l'événement consistant en ce que le système de variables 
aléatoires (X:1, X2, . .., X,) se trouve à l'intérieur d’un domaine D. 
Dans ce cas la probabilité de l'événement À peut être calculée par 
la formule (8.7.9). 
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Exemple. Trois paramètres X, Y. Z d'un appareil sont soumis à des 
essais. Pour que l’appareil soit accepté il faut que les événements suivants 
soient simultanément réalisés: 

4) Zo € À << TZ: 
2 Y<X; 
3 X>2Z> Tr. 

Les paramètres X, Y, Z sont trois variables aléatoires continues. à valeurs 

sitives, de densité de probabilité f (zx, y, z). Trouver la probabilité pour que 
‘appareil soit accepté. 


Solution. En désignant par À l’événement consistant en ce que l'ap- 
pareil soit accepté on trouve: 


pa=| {( {( f(z, y, s) de } dy } dr. 
xo 0 x 


8.8. Caractéristiques numériques d’un système 
de plusieurs variables aléatoires 


La loi de répartition d’un système, donnée par la fonction de 
répartition ou la densité de probabilité, est une caractéristique com- 
plète du système. Cependant, il est rare que cette caractéristique 
complète puisse être utilisée. Parfois les données expérimentales trop 
pauvres ne permettent pas de trouver la loi de répartition du système. 
Dans d’autres cas l’emploi d’un appareil aussi compliqué que sont 
les lois de répartition ne se justifie pas par la précision assez médiocre 
exigée des résultats. Enfin, dans certains problèmes on connaît 
d’avance la forme de la loi de répartition (loi normale par exemple) 
et il y a lieu d’en trouver les paramètres. 

Dans tous ces cas au lieu des lois de répartition on utilise une des- 
cription approchée, incomplète, d'un système de variables aléatoires, 
ceci à l’aide d’un nombre restreint de caractéristiques numériques. 

Enumérons ce minimum de caractéristiques permettant de carac- 
tériser un système de r variables aléatoires X;, X:, ..., À, : 

1) nr espérances mathématiques 


MA, Mo, CEE Mn) 


caractérisant les valeurs moyennes des variables; 
2) n variances 
Di, De, ..., D, 


caractérisant leur dispersion : 
3) n (n — 1) covariances 


Ky=MIXiX] (is), 
où 


Xi Xi—mi : X = \)=-m;; 
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caractérisant la corrélation de toutes les variables du système deux 
à deux. 

Notons qu’en fait la variance de chacune des variables aléatoires 
X, n'est rien d’autre qu'un cas particulier de la covariance, à savoir 
la covariance de la variable X,; et de la même variable X;: 


Di=Ka=MIXiXil = M IX:1. 


Il est commode de disposer toutes les covariances et les variances dans 
un tableau rectangulaire (appelé matrice) 


Ki K CR Kin 
K1 K2 CCR Kon 


K' ni K n CRE K'hn 


Ce tableau est appelé matrice de corrélation du système de variables 
aléatoires (X1, X2, ..., À). 

[Il est évident que tous les éléments de la matrice de corrélation 
ne sont pas différents. Par définition de la covariance on a KX;; — 
K;:, c'est-à-dire que les éléments de la matrice de corrélation 
symétriques par rapport à la diagonale principale sont égaux entre 
eux. C'est pour cela que souvent on n'’écrit pas toute la matrice de cor- 
rélation mais seulement sa moitié, y compris la diagonale principale: 


| Kan 


Pour simplifier l'écriture on désigne souvent la matrice de corré- 
lation d'éléments X;;, par le symbole || K;; ||. 

Dans la diagonale principale de la matrice on trouve les varian- 
ces des variables aléatoires X1, X2, ..., Xn. 

Dans le cas des variables non corrélees, tous les éléments de la 
matrice de corrélation sauf ceux de diagonale sont nuls: 


D, 0 0... 0 

D: 0 ... 0 

I Ki] = D: ... 0 
D: 


Une telle matrice est dite diagonale. 
Pour mieux faire apparaître la corrélation des variables aléatoi- 
res, indépendamment de leur dispersion, au lien de la matrice de 
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corrélation || K;, || on utilise souvent la matrice de corrélation normée 


Il 713 11 dont les éléments sont non pas les covariances mais les coeffi- 
cients de corrélation: 


Ki, 
010) ” 


Ti = 


= V D;, Oo = V D}. 


Il est évident que tous les éléments diagonaux de cette matrice sont 
égaux à l'unité. La matrice de corrélation normée est de la forme: 


1 Tyo Fais --- Tin 

y | Vos ee Von 

Iris = 1 l'an 
| 


Introduisons la notion de systèmes non corrélés de variables aléa- 


toires (ou de vecteurs non corrélés). Soient deux systèmes de variables 
aléatoires : 
- Ÿn) 


Aus As, ses Ans (eo Yi 
ou deux vecteurs aléatoires dans | l'espace à x dimensions: X de com- 
posantes (X1, X2, ..., X,) et Ÿ de composantes (Yi, Pa ass Xe): 
On dit que les vecteurs aléatoires X et Ÿ ne sont pas corrélés si aucune 
des composantes du vecteur X n'est corrélée avec aucune des compo- 
santes du vecteur Ÿ: 


Key, =MUXiŸ;]=0 pour i=1,...,n; j=1,... 


12— 2823 


CHAPITRE 9 


LOI DE RÉPARTITION NORMALE D'UN SYSTÈME 
DE VARIABLES ALÉATOIRES 


9.1. Loi normale dans le plan 


De toutes les lois de répartition d'un couple de variables aléa- 
toires la plus intéressante est la loi normale comme le plus fréquemment 
utilisée. Un système de deux variables aléatoires étant représenté 
par un point aléatoire dans le plan, la loi normale d’un couple est 
souvent appelée loi normale dans le plan. 

Dans le cas général la densité de répartition conjointe de deux 
variables aléatoires normales s'exprime par la formule 


(x— ms 2r(x-mx)(y—my)  (v-my? 
72 1-5 HE y a | 
2H0 r0y V1-r2 


f(z, y) — 
(9.1.1) 


Cette loi dépend des cinq paramètres: mx, My, Ox Op et Fr. 
Voyons le sens à attribuer à ces paramètres. Nous allons montrer que 
les paramètres m,, m, sont les espérances mathématiques (centres de 
dispersion) des variables X et Y ; 0:, 0, leurs écarts quadratiques 
moyens et r le coefficient de corrélation de X et Y. 

Pour s'en rendre compte nous allons tout d’abord trouver les den- 
sités de probabilité marginales des variables du système. En vertu de 
la formule (8.4.2): 


1 
T) — JT, d ES — XX 
fi (&) # Day = 
co (x-mx) _ 2r(x-mx) (y-my) (y-my)® 
+ Je nl % à 


Calculons l'intégrale 


(x—-mr)? 2r (x—-mMzr) (v—my) + (y—-my)3 


RE 2 
I == | 2 (1-—rt) oi OxOy oÿ 
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À cet effet, posons: 


—— = |, ——— —Ù, (9.1.2) 
On a alors: 


sd 1 
I =0y y 2 | e 1-r3 [u3—2ruv+v3] pa 


En calcul intégral on a: 


oo AC-—B1 
| e-4+2BxtCgr=)/ Le À *). (9.1.3) 


Dans notre cas: 


1 ru ___ ui 
A=T—x ; B= x ; nr te à 


En substituant ces valeurs dans la formule (9.1.3) on obtient : 
I =0, 2 Va(i—r) eu, 


d'où 
Îa (x) mi Oz V2x e—#, 
ou, compte tenu de (9.1.2): 
SL 
h(e)=— 7° 206 (9.1.4) 


Ainsi, la variable ZX suit une loi normale de centre de dispersion 
m, et d'écart quadratique moyen 0. 
D'une manière analogue on obtient: 
(y—-my)3 


__ À 207, 

RU)= 7e | (9.1.5) 
c'est-à-dire que Ÿ suit une loi normale de centre de dispersion m, et 
d'écart quadratique moyen ©;. 

Il reste à démontrer que le paramètre r dans la formule (9.1.1) 
est le coefficient de corrélation des variables X et Y. Pour cela calcu- 
lons la covariance: 


Kn= | | (c—m:)(y—m) f(x, y) ds dy, 


où M; M, Sont les espérances mathématiques de X et Y. 

*) Pour calculer l'intégrale (9.1.3) il suffit de compléter l'expression dans 
l’exposant de manière à en faire un carré entier et après le changement de 
variable d'utiliser l'intégrale d'Euler-Poisson (6.1.3). 


12e 
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En substituant dans cette formule l'expression de f (x, y) on 
obtient : 


| [«-m)(y—m)e-Amnazdy, (9.1.6) 


1 


K RE ,— 


où 


= L (z— mx)° 2r(z—mx)(y—my)  (y—my)? 


On effectue dans l'intégrale double (9.1.6) un changement de 
variables en posant: 


ee EE 


— =, a ————— 
0x V2 V2A—r2)\ © 
Le jacobien de la transformation est: 


z—mMx | 1 (—"* r TE) = 0. (9.1.7) 


par conséquent : 


Et [fu VDo, VTT (0 + ) ed 


2 IR © . 
A Î ue" du | we? du + 


u°e-" du ( et? di. 


Compte tenu de 


[ ue"? du — [ we? dw =0;: 


( u?e-u? du — Ve ; [ e-v? do V x, 


on a: 
K>y 
Key=r0x0y; rT= as (9.1.8) 
Nous avons ainsi montré que le paramètre r de la formule (9.1.1) 
est le coefficient de corrélation des variables X et Y. 


Supposons maintenant que les variables aléatoires X et Y suivant 
une loi normale dans le plan ne soient pas corrélées; ceci conduit 
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à poser dans la formule (9.1.1) r = 0. Alors: 


_(z=ms _ G@mui 


2 
f(x, = M (9.1.9) 


Il est facile de voir que des variables (X, Ÿ) normales de densité 
(9.1.9) sont non seulement non corrélées mais également indépendan- 
tes. En effet : 


_(x-mx} G-my} 


en=ne ee ho) 


c'est-à-dire que la densité de probabilité du système est égale au pro- 
duit des densités marginales, ce qui témoigne en faveur de l’indé- 
pendance des variables aléatoires (X, Y). 

Ainsi, dans le cas d’un système de variables aléatoires normales 
la non-corrélation entraîne également leur indépendance. Dans le 
cas de la loi normale dire « variables non corrélées » c’est dire aussi 
« variables indépendantes ». 

Pour r = 0 les variables aléatoires (X, Y) sont indépendantes. 
Il est facile de voir, en calculant les lois de répartition conditionnel- 
les à l'aide des formules (8.4.6), que l’on a: 


{ V—my x-mMmr\2 
7 72-73) re GX ] 
y) = —2— = es 
Oy 1 — 72 V/2x 
| X—Me y-my\2 
f(z|y) = 1 e Z2(1-r1) ( CO» Fe CR ] 


0x V1—r2 V2r 


Etudions l’une de ces lois de répartition conditionnelles, par 
exemple f (y|x). À cet effet nous allons écrire l'expression f (y |x) 
comme suit : 


i rer | [mur emo |’ 
U=—=xe TT ° 
y V1- r? V/2r 
Il est évident que c'est la densité de la loi normale de centre de dis- 
persion 
(e 
Mylx = My Tr — (z— mm.) (9.1. 10) 
et d'écart quadratique moyen 
Oytx = OyV 1—ri. (9.1.1) 


Les formules (9.1.10) et (9.1.11) montrent que dans la loi de ré- 
partition conditionnelle de Ÿ seule l'espérance mathématique dépend 
de la valeur fixée de À = x, la variance en étant indépendante. 
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La grandeur m,,, est appelée espérance mathématique condition- 
nelle de Y pour x donné. La relation (9.1.10) peut être représentée 
dans le plan rOy en portant l'espérance mathématique conditionnelle 
my, en ordonnées. On obtient une droite appelée droite de régression 
de Y en À. D'une manière analogue, la droite d’équation 


z=me+r = (y—m,) (9.1.12) 
y 


est la droite de régression de À en Y. 

Les droites de régression coïncident seulement lorsque la relation 
fonctionnelle entre Ÿ et X est linéaire. Quand X et Y sont indépen- 
dantes, les droites de régression sont parallèles aux axes de coordon- 
nées. 

En revenant à l'expression (9.1.1) de la densité de la répartition 
normale dans le plan on remarque que celle-ci est complètement déter- 
minée par cinq paramètres : deux coordonnées m,, m, du centre de 
dispersion, deux écarts quadratiques moyens 6,,0, et un coefficient 
de corrélation r. Les trois derniers paramètres sont à leur tour don- 
nés par les éléments de la matrice de corrélation, à savoir par les 
variances D,, D, et la covariance K,,. Ainsi, dans le cas de la loi 
normale, un nombre minimal de caractéristiques numériques du sys- 
tème, à savoir les espérances mathématiques, les variances et la cova- 
riance déterminent entièrement la loi de répartition, c'est-à-dire 
forment un système exhaustif de caractéristiques. 

Etant donné que dans les applications pratiques on rencontre 
souvent la loi normale, la plupart du temps, pour caractériser entiè- 
rement la loi de répartition d'un système, il suffit d'en donner le 
nombre minimal — cinq — de caractéristiques numériques. 


9.2. Ellipse de dispersion. Forme canonique 
de la loi normale 


Considérons lu surface de répartition représentant la fonction 
(9.1.1). Elle a la forme d'un monticule, dont le sommet se trouve au- 
dessus du point (m.,, m,) (fig. 9.2.1). 

Dans les sections de la surface de répartition par des plans paral- 
lèles à l'axe f (x, y) on obtient des courbes semblables aux courbes de 
la répartition normale. Dans les sections de la surface de répartition 
par des plans parallèles au plan z0y on obtient des ellipses. L'équa- 
tion de la projection d’une telle ellipse sur le plan zOy est : 

2r (z— _ — my)2 
Em) si ne de LIT NE LE = Const, 
% Oy 
ou en désignant la constante par 4, 
(z— mx)? — 2r (z2— m2) (y — My) (y—m,)? . 
ox OxOy Oÿ 


9.2] ELLJIPSE DE DISPERSION. FORME CANONIQUE DE LA LOI NORMALE 1483 


L'équation (9.2.1) de l’ellipse peut être étudiée par les méthodes 
habituelles de la géométrie analytique. On montre aisément que le 
centre de l’ellipse (9.2.1) se trouve au point de coordonnées (m,, m\,,,), 
les axes de symétrie de l’ellipse formant avec l’axe Oz des angles 
donnés par l'équation 


2r0x0 
Lg 20 = EN +). (9.2.2) 
[e) [e] 
Cette équation donne deux valeurs de l'angle a : &, et æ&2, différant 
de . ; 


Ainsi, l'orientation de J’ellipse (9.2.1) par rapport aux axes de 
coordonnées dépend directement du coefficient de corrélation r 


Fig. 9.2.1 


du système (X, Y’); si les variables X et } ne sont pas corrélées 
(dans le cas considéré indépendantes), les axes de symétrie de l’ellipse 
sont parallèles aux axes de coordonnées. 

En coupant la surface de répartition par les plans parallèles au 
plan zrOy et en projetant les sections sur ce plan rOy on obtient une 
famille d'’ellipses sembläbles, de même orientation et de centre 
commun (m,, m,). En tous les points d'une ellipse la densité de 
probabilite f (x, y) est constante. C’est pour cela qu'on les appelle 
ellipses d'égale densité ou ellipses de dispersion. Les axes communs lle 
toutes les ellipses sont les axes principaux de dispersion. 

On sait que l'équation d'une ellipse prend une forme particulie- 
rement simple, dite « canonique », lorsque les axes de coordonnées 
coïncident avec les axes de symétrie de l’ellipse. Pour rapporter 
l'équation de l'ellipse de dispersion à une forme canonique il suffit 


*) Cf. formule (14.7.4). 
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de transférer l’origine des coordonnées au point (m.,, m,) et de tour- 
ner les axes de coordonnées d’un angle donné par l'équation (9.2.2). 
La forme canonique de la loi normale dans le plan s'écrit : 


2 n? 


FE Dee À 2, (9.2.3) 


où Gt, On Sont les écarts quadratiques moyens principaux, c'est-à- 
dire les écarts quadratiques moyens des variables aléatoires (E, H) 
qui sont les coordonnées d’un point aléatoire dans le système des 
axes principaux de dispersion OË, On. Les écarts quadratiques 
moyens principaux o£ et o, s'expriment en fonction des écarts 
quadratiques moyens dans l’ancien système de coordonnées comme 
suit : 


oÙ = 04 cos? a + r0,0, sin 2a + 0? sin? a | . (9.2.4) 


0h =0%sin a—r0,0, sin 2a + 07 cos? « 


Généralement lorsqu'on envisage une loi de répartition normale 
dans le plan, on s'efforce d'orienter les axes de coordonnées Ox, Oy 
suivant les axes principaux de dispersion. Dans ce cas les écarts qua- 
dratiques moyens 0,, ©, seront les écarts quadratiques moyens 
principaux et la loi normale s'écrira : 


| 1 
LD =gse + (9.2.5) 


Dans certains cas on oriente les axes de coordonnées parallèle- 
ment aux axes de dispersion sans tout de même faire coïncider 
l'origine des coordonnées et le centre de dispersion. Les variables 
aléatoires (X, Y) se trouvent être indépendantes, l'expression de la 
loi normale étant 

“0 mr) _ Wm)? 


fen=me CE  %, (9.2.6) 


m;, My étant les coordonnées du centre de dispersion. 
Passons dans la forme canonique de la loi normale (9.2.5) des 
écarts quadratiques moyens aux écarts probables : 


E, — pV 20; E, = pY 20,. 


Les grandeurs E,, E, sont appelées écarts probables principaux. 
En exprimant 0, 6, à l'aide de E., E, dans l'équation (9.2.5) on 


*) Pour la démonstration de ces formules voir $& 14.7. 
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obtient une autre forme canonique de la loi normale : 


+2 y2 
ps [—+— 
__p? (Æ E3 
» Y) == e FM 9.2.7 
fGY=RE, (9.2.7) 
Cette forme de la loi normale est souvent utilisée dans la théorie 
du tir. 
Ecrivons l'équation de l’ellipse de dispersion sous forme canoni- 
que, soit : 
73 


y? 
+ = où rt Hegr = 


T = 1, (9.2.8) 


où Æ est une constante. 

Cette équation montre que les demi-axes de l’ellipse de dispersion 
sont proportionnels aux écarts quadratiques moyens principaux 
(donc également aux écarts probables principaux). 

On appelle ellipse de dispersion unitaire celle des ellipses d’égale 
densité, dont les demi-axes sont égaux aux écarts quadratiques 
moyens 0,, C,. (Si on utilise pour caractériser une dispersion non pas 
les écarts quadratiques moyens principaux mais les écarts probables 
principaux on appelle ellipse unitaire l’ellipse dont les demi-axes sont 
E,, E,). 

D'une grande utilité est également la notion d’ellipse de dispersion 
totale. C'est une ellipse d’égale densité qui englobe toutes les valeurs 
possibles d’un couple de variables avec une certitude suffisamment 
élevée. Il est clair que les dimensions de cette ellipse dépendent de ce 
qu'on entend par « certitude suffisamment élevée ». En particulier, 
si on peut se contenter d'une probabilité de l’ordre de 0,99, l’ellipse 
de dispersion totale sera l’ellipse de demi-axes 30,, 30;. 

Arrêtons-nous sur un cas particulier où les écarts quadratiques 
moyens principaux sont égaux entre eux : 


Ox — Oy = ©. 


Dans ce cas les ellipses de dispersion deviendront des cercles et la 
dispersion est dite circulaire. Ce cas présente cette particularité que 
chacun des axes passant par le centre de dispersion peut être considéré 
comme l’axe principal ou, en d’autres termes, la direction des axes 
principaux est indéterminée. Pour une dispersion non circulaire, 
des variables aléatoires À, Ÿ réparties suivant une loi normale dans 
le plan sont indépendantes seulement si les axes de coordonnées sont 
parallèles aux axes principaux de dispersion et ceci quel que soit 
le choix du système de coordonnées rectangulaire. Cette particula- 
rité de la dispersion circulaire la rend bien plus commode que la 
dispersion elliptique. C’est pour cela qu'on essaie dans la mesure 
du possible de remplacer des dispersions non circulaires par des dis- 
persions circulaires. 
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9.3. Probabilité de tomber dans un rectangle 
de côtés parallèles aux axes principaux 
de dispersion 


Supposons que le point aléatoire (X, Y) suive la loi normale 
(x-m,)3  (y-m,,)° 
1 7 7 29 20: ” 
f (2, y) one x SU . (9.3.1) 
Dans ce cas les axes principaux de dispersion sont parallèles aux 
axes de coordonnées et les variables À et Y sont indépendantes. 
I1 y a lieu de calculer la probabilité pour le point aléatoire (X, Y) 
de se trouver dans le rectangle À dont les côtés sont parallèles aux 


sE. 


Fig. 9.3.1 


axes de coordonnées Oz, Oy et par conséquent aux axes principaux de 
dispersion (fig. 9.3.1). En vertu de la formule (8.3.4) on a: 


B © 
PA YER)= | Îr(x mardy= 
B (x—m,)? En (y—m,,)? 
1 7 20% 1 T7 7 2o2 
— — — dy, 
Î Ox V2r TU Oy V2n : UE 


d'où, utilisant la formule (6.3.3) pour la probabilité de tomber dans 
un intervalle déterminé, on obtient : 
PAR PE Re[or (lan) 0 (2e) ] + 


x 
Ô—m y—m sn 
RE. Dr € 
x [® ( > )—o* ( - ) |: (0.3.2) 
où ®* (x) est la fonction de répartition normale. 
Si la loi normale dans le plan est donnée sous forme canonique on 
am, = My = 0 et la formule (9.3.2) devient : 


P((X, Y)<R)= 
=œ(2)-0()le(s)-c(+)]. 635 
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Si les côtés du rectangle ne sont pas parallèles aux axes de coor- 
données, les formules (9.3.2) et (9.3.3) ne sont plus applicables. 
Ce n'est que dans le cas de la dispersion circulaire que la probabilité 
de tomber dans un rectangle d'orientation quelconque se calcule par 
l’une des formules (9.3.2) ou (9.3.3). 

On utilise fréquemment les formules (9.3.2) et (9.3.3) lors des cal- 
culs des probabilités d'atteindre des cibles rectangulaires, presque 
rectangulaires, formées de rectangles ou susceptibles d’être approxi- 
mativement remplacées par des rectangles. 


Exemple. Un appareil est vérifié suivant deux paramètres X et Y. 
Ces deux paramètres sont indépendants et répartis suivant une loi normale 
de parametres 
Me = 2, 0, —=0,8; my—4, 07 = 0,5. 


Pour que l'appareil soit accepté il faut et il suffit que le paramètre X se trouve 


Fig. 9.3.2 


entre 1 et 4, et le paramètre Y entre 3 et 5. Trouver la probabilité pour que 
l'appareil satisfasse à ces conditions. 

Solution. Il ya lieu de trouver la probabilité pour le point aléatoire 
(X, Y) de se trouver dans le rectangle R représenté sur La figure 9.3.2. 

En utilisant la table 4 de l'annexe on trouve: 


PaNcne(o()-0 (5) ][o (55) -0 (55) ]- 
— (0% (2,5) — D (—1,25)] [DO (2)—D® (—2)] = 
= [0,9938 — 0,1056] [0,9772 — 0,0228] = 0,848. 


9.4. Probabilité de tomber dans l'ellipse 
de dispersion 


L'ellipse de dispersion (ellipse d’égale densité) est l’une des rares 
figures planes à l’intérieur des quelles un point peut se trouver avec 
une probabilité calculable sous forme explicite. 
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Supposons que l’on se donne la forme canonique de la loi normale 
dans le plan: 


(9.4.1) 


Considérons l’ellipse de dispersion B, d’équation 

où le paramètre k est le rapport des demi-axes de l’ellipse de disper- 
sion aux écarts quadratiques moyens principaux. En vertu de la for- 
mule générale (8.3.3) on a: 


P(X Ye B)= || f(x, pardy= 


(B;) 


; -F(5 +) 
2 2 
= {| moe “VA Gard. (9.4.2) 
(B,) 
Après le changement de variables 
E 4 


—=t —=V 


Ox Oy 
l’ellipse B, devient un cercle C, de rayon k. Par conséquent : 
u vi 
P({X, NeB=7 fe 777 du dv. (9.4.3) 
(C) 


Passons dans l'intégrale (9.4.3) du système cartésien au système 
polaire, en posant: 
u =rcos 6; v = r sin 6. (9.4.4) 


Le jacobien de la transformation (9.4.4) est égal à r. Après le change- 
ment de variables en question l'expression (9.4.3) devient : 

x k r3 R r3 k1 
P(X,Y)e B)=+ | | re ? dr dô=— re” T'drmi—0 €. 


—X 


Ainsi, la probabilité pour un point aléatoire de se trouver à l'in 
térieur de l’éllipse de dispersion dont les demi-axes sont k fois les 
écarts quadratiques moyens est : 

h2 


P((X,Y)cB:»)=1—e ©. (9.4.5) 


A titre d'exemple, nous allons calculer la probabilité pour un 
point aléatoire réparti suivant une loi normale dans le plan x0y de 
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se trouver dans l'ellipse de dispersion unitaire dont les demi-axes 
sont 


a = 6,; bd = 04. 
Pour une telle ellipse k — 1. On a alors 
1 
P((X, Y) œB;)=1—e ©. 
Dans la table 2 de l’annexe on trouve 
P((X, Y)c B:)= 0,393. 


La formule (9.4.5) est principalement utilisée pour calculer la 
probabilité de tomber dans un cercle dans le cas de la dispersion cir- 
culaire. 


Exemple. Un nuage d'éclats représentant un disque plan (cercle) de 
rayon À — 30 m barre le chemin à un objectif mouvant de petite dimension, 
de surface 1,2 m. A l’intérieur du disque la densité des éclats est constante 
et égale à 2 éclats par m2. Si le nuage recouvre entièrement l'objectif, le nombre 
d’éclats le touchant est réparti suivant une 
loi de Poisson. L'objectif étant petit, on 
peut le supposer ponctuel et considérer qu'ou 
bien il est entièrement recouvert par le nua- 
ge d'éclats (si son centre se trouve à l'inté- 
rieur du cercle) ou n’est pas du tout recou- 
vert (si son centre ne se trouve pas dans le 
cercle). Le but est atteint lorsqu’au moins 
un éclat l’ait touché. Lors de la visée on s’ef- 
force à faire coïncider dans le plan rOy le 
centre O, du cercle avec l’origine des coordon- 
nées O (centre de l'objectif), mais les erreurs 
de visée font que le point O, se trouve disper- 
sé au voisinage de O (fig. 9.4.1). La loi de 
dispersion est normale, la dispersion est cir- 
culaire avec © = 20 cm. Trouver la proba- Fig. 9.4.1 
bilité P (A) d'atteindre le but. Boo 

Solution. Pour que le but soit at- 
teint par les éclats, il faut que les deux événements suivants coïncident: 
1) l’objectif (point O) entre dans le nuage d'éclats (cercle de rayon ZX) et 


2) au moins un éclat le touche à condition que le premier événement se soit réa- 
i 


La probabilité de l'événement : « objectif entre dans le cercle » est de toute 
évidence égale à la probabilité pour que le centre du cercle (point aléatoire O,) 
se trouve dans un cercle de rayon RÀ avec le centre à l’origine des coordonnées. 
Appliquant la formule (9.4.5), on a: 


30 
k = 20 = 1 2. 
La probabilité cherchée est : 


p=i—e 2? 20,675. 


Puis nous allons trouver la probabilité p* pour que l’objectif soit atteint 
à condition d'être recouvert par le disque d’éclats. Le nombre d'éclats attei- 
gnant l'objectif est égal au produit de l'aire de l'objectif par la densité du nuage 
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d'éclats : 


La DRASS conditionnelle ;* d'atteindre le but n’est rien d'autre que 
la probabilité qu’au moins un éclat l’atteigne. En utilisant la formule (5.9.5) 
du chapitre 5 on a: 


p*=Ri—=1—e-sx 0,909. 
La probabilité pour que l'objectif soit atteint est: 
P (A) = 0,675-0,909 = 0,613. 


Nous nous servons de la formule (9.4.5) pour énoncer une loi 
fort importante pour les applications pratiques, à savoir la Loi de 
Rayleigkh. 

Considérons un point aléatoire (X, Y') dans le plan zOy (fig. 9.4.2) 
se dispersant autour de l’origine des coordonnées © suivant une loi 
normale circulaire, d'écart quadratique moyen ©. Nous allons trou- 
ver la loi de répartition de la grandeur aléatoire R, distance du point 
(X, Y) à l'origine des coordonnées, c’est-à-dire de la longueur du 
vecteur aléatoire de composantes X, ÿ. 

Cherchons tout d’abord la fonction de répartition F (r) de R. Par 


définition 
Finn =P(R<r). 


Ce n’est rien d’autre que la probabilité pour le point aléatoire 
(X, Y) de se trouver à l’intérieur d’un cercle de rayon r (fig. 9.4.2). 
La formule (9.4.5) permet de trouver cette probabilité : 


h2 


F(rn=1—e ?; 


re r 
ici À = — , donc 
o 
r2 


F(r}=1—e 2%. (9.4.6) 


Cette expression de la fonction de répartition n’a de sens que pour 
des r positifs ; pour r << 0 on doit poser F (r) = 0. 

En dérivant la fonction de répartition F (r) par rapport à r on 
trouve la densité de probabilite : 


r? 
pod  pur>0, (9.4.7) 


o?2 
0 pour r<<0. 


La loi de Rayleigh (9.4.7) se rencontre dans de nombreuses appli- 
cations pratiques ; citons parmi d’autres la théorie du tir, la radio- 
technique, l’électrotechnique, etc. 

Le graphique de la fonction f (r) (densité de la loi de Rayleigh) 
est donné sur la figure 9.4.3. 
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Calculons les caractéristiques numériques de la grandeur R 
répartie suivant la loi de Rayleigh: son mode o«# et son espérance 
mathématique m,. Pour trouver le mode, qui est l’abscisse du point 


Fig. 9.4.2 


où la densité de probabilité est maximale, il y a lieu de dériver 
f (r) et d'annuler cette dérivée, on obtient : 


r2 2 
1——7=0; o?=r*, 


La racine de cette équation est le mode cherché 
of = 0. (9.4.8) 


Ainsi, la valeur la plus probable de la distance À du point aléatoire 
(X, Y) à l'origine des coordonnées est égale à l’écart quadratique 
moyen de la dispersion. 

L'espérance mathématique m, est donnée par la formule: 


Mr = rf (r) dr = Re dr. 


Après le changement de variables 


r 


o V2 


= 


on obtient: 
m=0V2 | 2tte-2 dt = 0 V2 | t.2te-F dé. 
U U 
L'intégration par parties donne: 


m= 0 VÎVE 20 Ex 1,250. (9.4.9) 
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9.5. Probabilité de tomber dans un domaine 
de forme arbitraire 


Dans le tir par obus percutants la probabilité d'atteindre le but 
est la probabilité pour le point (X, Y) de se trouver dans un certain 
domaine D. Supposons que le point aléatoire (X, Y) suive une loi 
normale et que cette loi soit donnée sous forme canonique. La proba- 
bilité pour le point (X, Ÿ) d'atteindre le domaine D est donnée par 
l'intégrale : 

x2 


RER 
P((X, PeD)=mes le 207 26} Grdy. (9.5.1) 
(D) 


Dans certains cas particuliers (par exemple lorsque le domaine D 
est un rectangle dont les côtés sont parallèles aux axes principaux 
de dispersion ou si c’est une ellipse de 
dispersion) l’intégrale (9.5.1) peut être 
exprimée par des fonctions connues, ce 
qui n'est pas possible dans le cas gé- 
néral. Il est d'usage d'employer l’une 
des méthodes approchées suivantes. 

1. Le domaine D est remplacé d’une 
manière approchée par un domaine 
formé de rectangles dont les côtés sont 
parallèles aux axes principaux de dis- 
persion (fig. 9.5.1). La probabilité de 
tomber dans chacun de ces rectangles 
est donnée par la formule (9.3.3). On 

Fig. 9.5.1 peut recommander cette méthode dans 
le cas où le nombre de rectangles rem- 
plaçant le domaine D n'est pas trop important. 

2. Tout le plan zOy est divisé d'avance par un quadrillé (rectili- 
gne ou courbe). Les probabilités d’atteindre chacune des cases peuvent 
s'exprimer exactement par des fonctions connues et l’on calcule ces 
probabilités. Ce quadrillage complété des probabilités d'atteindre 
les cases correspondantes est appelé réseau de dispersion. L'usage 
d’un tel réseau est simple : on applique le réseau sur l’image de l'objec- 
tif et on prend la somme des probabilités d'atteindre les cases 
recouvertes par l'objectif ; s’il recouvre une partie seulement de la 
case, la probabilité est prise proportionnellement a l’aire recouverte. 

On peut utiliser le réseau de dispersion de deux manières diffé- 
rentes : a) dessiner le but à l’échelle du réseau, b) dessiner le réseau 
à l'échelle du but. 

Lorsque la forme du but est compliquée et surtout si celui-ci 
n’est pas grand, il est plus commode de tracer sur l’image du but 
et à son échelle la partie du réseau occupée par celui-ci. Si au contrai- 
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re la forme du but est relativement simple et ses dimensions sont 
assez grandes (c'est-à-dire que le but occupe une partie importante 
de l’ellipse de dispersion), il est plus commode de dessiner le but 
à l'échelle du réseau. Comme le réseau normalisé correspond à une 
dispersion circulaire et les dispersions réelles ne le sont pas en général, 


PONNONOONNNODONRESES 
ijofr[ofrfofolrfololololofolrT TT TT 
lifofr{of1{olr[ololr[ololofol TT 111 
elrfrfrfrfrlolrfofrfololrfolol TT TT] 
lelefrfrfififrlrfolsfrlolofofol | TT 
Def2/2[1[r{1frlilrfrfifrfololrfolololrfol 


eteteotepopopepepeupiufe 
BOOO0O0OBGANONNE 100 
6l6]6[s[s[s/4[«ls/zlelelrflrfrlolo 


7|elelefslélælslelelel: o[oio 
s/elel7|7|6[s{s/slsfs CPE AE 
dols[s/elelrls 

Lojwlwlwlelsl7|s]s]s/efsfelehsfeleletoir 
ufulolwlsfs{rlels[s|slsfefel2lrfrloflt}o 
ulufulwlsls[slz]efs|slsfstelelelprlrfolo 
pefufuTrwfws|slr[els{s!æfsfzlelelelrTrfr}z 


Fig. 9.5.2 


en traçant le but à l'échelle du réseau on est obligé d'utiliser des 
échelles différentes suivant les axes Ox et Oy. Pour faciliter l’opéra- 
tion il est commode de décalquer un réseau de dispersion sur un papier 
transparent que l’on superpose à l’image du but. Sur la figure 9.5.2 
on a donné à titre d'exemple un réseau rectiligne de dispersion pour 
un quadrant. Le côté d’une case est égal à 0,2 E = 0,133 o. On a ins- 
crit dans les cases les probabilités de les atteindre, exprimées en 
quarantièmes de pour cent. 


13—2823 
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3. Lorsque les dimensions du domaine D ne sont pas importantes 
par rapport aux écarts quadratiques moyens (sont en-dessous de 0,5 
à 10 dans les directions des axes de coordonnées), la probabilité 
d'atteindre ce domaine peut être cal- 
culée par une formule approchée ne 
contenant pas d'intégration. 

Soit dans le plan zOy un petit 
but D de forme quelconque (fig. 9.5.3) 
dont les dimensions sont petites par 
rapport aux écarts probables E,, £,. 
En vertu de la formule générale on a: 


PIX Y)E D) =[( f( y) drag, 
(D) 


Fig. 9.5.3 (9.5.2) 


où f (x, y) est la densité de probabilité du système (X, Y). En appli- 
quant à l'intégrale (9.5.2) le théorème de la moyenne, on a: 


P((X, Y) € D) =f(&0 vo) | | dx dy = f (ro vo) So, 
(D) 


Où (Zo, Yo) est un certain point à l’intérieur du domaine D; S 
l’aire du domaine D. 
Dans le cas où la loi du système (X, Y) est normale et donnée sous 
forme canonique, on a: 
xü_ _ _Vo_ 


P((X,Y)aD)=- De 20% 20, (9.5.3) 


270 x0y 


Les dimensions du domaine D n'étant pas importantes, la densité 
de probabilité f (x, y) varie peu dans ce domaine et peut être supposée 
constante. Dans ce cas on peut prendre pour le point (xs, yo) un point 
quelconque du domaine D (par exemple, le centre approximatif du 
but). 

Les formules du type (9.5.3) sont couramment utilisées dans les 
applications pratiques. Pour les domaines dont les dimensions maxi- 
males ne dépassent pas 0,50 dans la direction correspondante, la 
précision des résultats obtenus est tout à fait satisfaisante. Dans 
certains cas elles peuvent également être utilisées pour les dornai- 
nes plus importants (de l’ordre d'un écart quadratique moyen). 
A condition d'introduire certaines corrections (en majorant un peu 
les valeurs de 6., ©,) le domaine d’application de cette formule peut 
être étendu à des figures de deux écarts quadratiques moyens de 
dimension. 
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9.6. Loi normale dans l’espace à trois dimensions. 
Forme générale de la loi normale pour un système 
d'un nombre arbitraire de variables aléatoires 


Lors de l’étude des questions liées au tir par obus fusants on a af- 
faire à la loi de répartition des points d’explosion de l’obus dans 
l'espace. Lorsque l’on utilise des fusées fusantes ordinaires, cette 
loi de répartition est approximativement normale. 

Dans le présent paragraphe nous n’envisagerons que la forme cano- 
nique de la loi normale dans l’espace: 


{ +2 LS z2 
1 tft gta) 
(2x)°/2 0,0/0z 


f(x, Y; z) = , (9.6.1) 
OÙ Oz, Oyr O Sont les écarts quadratiques moyens principaux. 


En passant des écarts quadratiques moyens aux écarts probables 
on a: 


Ro 6. 
f(x, y, 2) TEE, 8 x ‘y ; (9.6.2) 

Dans les problèmes de tir par obus fusants, il y a parfois lieu de 
calculer la probabilité d’explosion d'un obus à l’intérieur d’un do- 
maine D donné. Dans le cas général cette probabilité s'exprime par 
l'intégrale triple suivante: 


P((X,Y,2)c D) = | | | f (x, y, z) dr dy dz. (9.6.3) 
(D) 
En général on ne peut exprimer l'intégrale (9.6.3) au moyen de 


fonctions élémentaires. Cependant, il existe un certain nombre de 
domaines pour lesquels il est facile de trouver les probabilités. 


1. Probabilité d'atteindre un parallélépipède rectangulaire de côtés 
parallèles aux axes principaux de dispersion 


Soit R un parallélépipède rectangulaire limité par les abscisses 
æ, BP, les ordonnées y, Ô et les cotes e, n (fig. 9.6.1). La probabilité 
de tomber dans le domaine R est de toute évidence égale à ; 


P((X, Y, 2) R)=[@"| p 0 (Æ)]x 


«fo (4)-0-(2)][e (2-0 (5) 050 


2. Probabilité d'atteindre un ellipsoide d'égale densité 
Considérons l’ellipsoïde B, d'égale densité d’équation 


22 y? 22 : 
area 
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Les demi-axes de cot ellipsoïde sont proportionnels aux écarts 
quadratiques moyens principaux : 


a = ko,; b = ko, ; c = ko.. 


En utilisant la formule (9.6.1) pour f (x, y, z) écrivons la probabilité 
d'atteindre l’ellipsoide B, : 


P ((X, Y, 2) (es Bh) — Es LP 0x0y0z 


Ji FE) ae aude. 


Passons des coordonnées cartésiennes aux coordonnées polaires 


Fig. 9.6.1 


(sphériques) par le changement de variables 
—=rcos6 cosy, 
7, =" c0s0 sin p, (9.6.5) 
— = r sin 6. 


Le jacobien de la transformation (9.6.5) est : 
I = r cos 00,0,0. 
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En passant aux nouvelles variables, on a: 
P((X, Y, 2) Br)= 


2 2x 


ii) 


R 3 


r3 ? 
cos%e 7 drddp=}/ + ne dr. 


En intégrant par parties on obtient finalement: 
ns À 

P(X Y,DcB)=Y + { —ke TL | e 
Ù 


T är} _ 
k3 


— 20° (&)—1—7/ 2 ke Z. (9.6.6) 


3. Probabilité d'atteindre un domaine cylindrique dont la 
génératrice est parallèle à l’un des axes principaux de 
dispersion 


Soit un domaine cylindrique C dont la génératrice est parallèle 
à l’un des axes principaux de dispersion (par exemple à l'axe Oz) 
et la directrice est un contour du domaine quelconque D dans le 
plan xOy (fig. 9.6.2). Supposons que le cylindre C soit limité par 


Fig. 9.6.2 Fig. 9.6.3 


deux plans z — e et z — n. Caiculons la probabilité d'atteindre le 
cylindre C. On conçoit aisément que c’est la probabilité de la réali- 
sation simultanée de deux événements suivants: 1) le point (X, Y) 
tombe dans le domaine D, 2) la variable Z se trouve dans l'intervalle 
(e, n). Les variables (X, Y, Z) suivant une loi normale sous forme 
canonique étant indépendantes, les deux événements en question le 
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sont également. Ainsi 


—P((X, Y)cD) [ o* (2) 0: (=) |: (9.6.7) 


La probabilité P ((X, Y) € D) figurant dans la formule (9.6.7) 
peut être calculée par l’une quelconque des méthodes de calcul des 
probabilités d’atteindre un domaine plan. 

La formule (9.6.7) se trouve à la base de la méthode suivante de 
calcul des probabilités d'atteindre l’espace G de forme quelconque : 
on divise approximativement le domaine G en plusieurs domaines 
cylindriques G;, G2, ... (fig. 9.6.3) et on calcule la probabilité 
d'atteindre chacun d'eux par la formule (9.6.7). Pour utiliser cette 
méthode il suffit de dessiner les figures qu’on aura dans les sections 
du domaine G par des plans parallèles à l'un des plans de coordonnées. 
La probabilité d'atteindre chacune de ces figures planes peut être 
calculée à l’aide du réseau de dispersion. 


Pour conclure ce chapitre nous allons écrire l'expression généra- 
le de la loi normale dans l’espace pour un nombre quelconque de 
dimensions 7. 

La densité de probabilité de cette loi est : 


n n 
{ —_ —_ 


f(x, T2, -..s Zn) TERRE mo. , (9.6.8) 
(27) ? 
où | C | est le déterminant de la matrice C = ||C:l|, qui est la matrice 
inverse de la matrice de corrélation À = ||K;;l|. On a: 
sai M 
Ci; =(—1)" 4j k 


où | À | est le déterminant de la matrice de corrélation, et M, 
le mineur de ce déterminant obtenu en barrant la i-ème ligne et la 
j-ième colonne. Notons que 
1 
ICE kr 

De l'expression générale (9.6.8) s’obticnnent toutes les formes 
de la loi normale pour un nombre quelconque de dimensions et 
quelles que soient les relations entre les variables aléatoires. En 
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particulier pour 7 —2 (dispersion dans le plan) la matrice de 
corrélation est 

07  O:0p 
O;0O7 07 
où r est le coefficient de corrélation. D'où: 


|K|=oo;(1—7r); 1C|= 


1 
UT ? 
2 à 
C=— O2 (1—7r2) OxOy (1 —ri) | 
A 
OxOy(1—r?) oi (1—r?) 
En substituant le déterminant |[C | et les termes de la matri- 
ce C dans (9.6.8) on obtient la formule (9.1.1) pour la loi nor- 


male dans le plan par laquelle nous avons commencé le paragra- 
phe 9.1. 


CHAPITRE 10 


CARACTÉRISTIQUES NUMÉRIQUES DES FONCTIONS 
DE VARIABLES ALÉATOIRES 


10.1. Espérance mathématique. Variance 


Pour résoudre ditférents problèmes liés aux phénomènes aléatoi- 
res la théorie moderne des probabilités fait appel aux lois des varia- 
bles aléatoires, qu’il importe de connaître. On pourrait déterminer 
ces lois expérimentalement, mais en général les expériences visant 
à trouver la loi de répartition d’une variable ou d’un système de 
variables aléatoires (surtout dans le domaine militaire) sont compli- 
quées et coûteuses. Le problème qui se pose tout naturellement est 
de réduire au minimum le volume des expériences et d'essayer de se 
faire une idée des lois inconnues en se basant sur les lois connues 
d’autres variables aléatoires. On procède par des méthodes indirec- 
tes, qui jouent un rôle particulièrement important dans la théorie 
des probabilités. En général la variable qui nous intéresse est une 
fonction d’autres variables aléatoires ; connaissant la loi de répar- 
tition des arguments on arrivesouvent à trouver la loi de la fonction. 
Plusieurs problèmes de ce genre seront étudiés au chap. 12. 

Souvent dans la pratique on n'a pas besoin de déterminer com- 
plètement la loi de répartition d'une fonction des variables aléa- 
toires, on peut se contenter de quelques caractéristiques numéri- 
ques : il suffit de connaître l'espérance mathématique, la variance 
et parfois plusieurs moments d'ordre élevé. Il arrive souvent que 
les lois mêmes des arguments ne sont connues que très approxima- 
tivement. Il s’agit alors de déterminer seulement les caractéristi- 
ques numériques des fonctions de variables aléatoires. 

Examinons le problème suivant : soit Ÿ une fonction de plusieurs 
variables aléatoires X,, X2, ..., X,: 


Y = p(X:, Hosts A) 


Supposant connue la loi de répartition du système d'arguments 
Xi, X2, ... ZX), trouver les caractéristiques numériques de Ÿ et 
en premier lieu, son espérance mathématique et sa variance. 

Si l’on a pu déterminer la loi de répartition g (y) de Y, il est 
facile de trouver les caractéristiques numériques; celles-ci sont 
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données par les formules: 


My = | yg(y) dy; 


Dy = | (y—m,) g (y) dy, 


etc. 

Cependant il est souvent difficile de trouver la loi de répartition 
g (y) de Y. Mais pour résoudre le problème posé il n'est pas néces- 
saire de connaître cette loi, il suffit de savoir la loi des arguments 
(X:,, X2,..., Xh). Dans certains cas pour trouver les caracteristi- 
ques numériques d’une fonction aléatoire il n'est même pas néces- 
saire de connaître la loi de répartition des arguments, les caracté- 
ristiques numériques des arguments suffisent. 

On voit alors apparaître le problème de la détermination des 
caractéristiques numériques des fonctions des variables aléatoires 
sans en connaître les lois de répartition. 

Commençons par déterminer les caractéristiques numériques 
d'une fonction, la loi de répartition des arguments étant donnée. 
Considérons le cas le plus simple, à savoir celui d’un seul argument. 

Soit une variable aléatoire X de loi de répartition donnee et 
soit une autre variable aléatoire Y liée à X par la relation fonc- 


tionnelle : 
Y = p(4). 
Calculer, sans trouver la loi de répartition de Y, l'espérance 
mathématique 
my == Mp(X)l. (10.1.1) 


Considérons tout d'abord le cas où À est une variahle aléatoire 
discrète donnée par le tableau de répartition ci-dessous : 


AEAETRRRES 
PiN Pal P2l --- | Pn 


Nous allons écrire comme suit les valeurs possibles de Ÿ et les pro- 
babilités correspondantes : 
AGDE RACE CORRE ACL (10.1.2) 
pi OU OPa | P2a |--.1 Pn 
Le tableau (10.1.2) n’est pas, en toute rigueur, celui de la variable 
Ÿ , car dans le cas général certaines des valeurs 
p (x), P(x2), +. ., ® (an) (10.1.3) 


peuvent coïncider; de plus les valeurs dans la ligne supérieure ne 
sont pas obligatoirement disposées par ordre croissant. Pour passer 
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du tableau (10.1.2) à la suite réelle de répartition de Y il aurait fallu 
disposer les valeurs (10.1.3) par ordre croissant et réunir les colonnes 
correspondant aux valeurs égales de Ÿ en additionnant leurs proba- 
bilités. Cependant ici la vraie loi de répartition de Ÿ ne nous inté- 
resse pas; pour trouver l'espérance mathématique le tableau non 
ordonné (10.1.2) nous suffit. L'’espérance mathématique de Ÿ est 
donnée par la formule: 


M Ip(X)] = 2 p(zi) pee (10.1.4) 


I1 est évident que la grandeur m, — M [œ (X)] ne peut changer si 
dans la somme on réunit d'avance certains termes ou on en change 
l'ordre. 

Dans la formule (10.1.4) de l’espérance mathématique d’une fonc- 
tion, la loi de répartition de la fonction n'apparaît pas d'une maniè- 
re cxplicite, on y voit seulement la loi de répartition de l'argument. 
Ainsi, pour trouver l'espérance mathématique d'une fonction il n'est 
pas nécessaire de connaître la loi de répartition de cette fonction, il 
suffit de connaître la loi de l'argument. 

En remplaçant dans la formule (10.1.4) ia somme par une inté- 
grale et la probabilité p; par un élément de probabilité, on obtient 
une formule analogue pour une variable aléatoire continue: 


Mip(OI= | p(x)f(z)ar, (40.1.5) 


où f (:) est la densité de probabilité de X. 
De même on trouve l'espérance mathématique de la fonction 


p (X, }’) de deux arguments aléatoires X et Y. Pour des variables 
discrètes on a: 


M Iq(X, Y)] = 2 2 P(Zi V3) Pis, (10.1.6) 


Puy == P((X = zx;) (Y = yj)) étant la probabilité pour que le système 
(X, Y) prenne la valeur (x:, y;). 
Pour les variables continues on a: 


MX Y)= [fem mpazdy, (101.7) 


f (zx, y) étant la densité de probabilité du système (X, Ÿ). 
D'une manière analogue on peut trouver l’espérance mathémati- 
que d'une fonction d’un nombre quelconque d'arguments aléatoires. 
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Nous allons donner la formule dans le cas des variables continues : 
M1 (44; À, sers X n)] — 


= | Ne fpezss 20) (a 22 2, 2n) de des. den, (10.1.8) 


f (Zi, Ze, . - -, Zn) étant la densité de probabilité du système (X;, 
2% + » «9 n/° 
Ainsi, l'espérance mathématique d’une fonction d’un nombre 
quelconque d'arguments aléatoires peut être calculée indépendam- 
ment de la loi de répartition de la fonction. D'une manière analogue 
on peut trouver d’autres caractéristiques numériques d’une fonction, 
à savoir ses moments d'ordre quelconque. Chaque moment étant 
l'espérance mathématique d’une certaine fonction de la variable 
aléatoire étudiée, on peut les calculer par des méthodes analogues 
à celles exposées ci-dessus. Nous ne donnerons ici que les formules de 
la variance et ceci pour le cas des arguments aléatoires continus. 
La variance d'une fonction d’un argument aléatoire est donnée 
par la formule: 


Dip(X= | 1p(2—molt (2) dr, (10.1.9) 


où my, = Mly(x)l est l'espérance mathématique de la fonction 
o (X) et f (x) la densité de probabilité de X. 

La variance d’une fonction de deux arguments s'exprime par une 
formule analogue, soit : 


Dip(X, YN= | Ÿ lez. y—molt f(x, y)dz dy: (10.110) 


ici m, est l'espérance mathématique de la fonction œ (X, Y) et 
f (x, y) la densité de probabilité du système (X, Y). 

Enfin dans le cas d’un nombre quelconque d'arguments, on a dans 
les mêmes notations: 


DIp(Xs, X2, -., Xn)] = 
= | +. | [P(ti, La, -.., Zn) — Mol? f (Ts Lo, . .., Zn) dry da2 ... den. 


(10.1.11) 


Remarquons que souvent dans les calculs de la variance il est 
commode d'utiliser la relation existant entre les moments initial 
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et centré du second ordre (voir chapitre 5) et d'écrire: 


DIPOOI= | 1p(aN* (x) d2— m3: (40.112) 


Dip(X, Y)= (lets pit, D'ardy—ms; (10.113) 
à D[p(X\, X;, sin) = 
— | 2e Î [P(Trs, Te, -.., Zn) (T1, Te, -.., Zn) Ars das... drn— m3. 


(10.14.14) 


Les formules (10.1.12)-(10.1.14) peuvent être recommandées dans les 
cas où elles ne conduisent pas à des différences de nombres voisins, 
ce qui a lieu lorsque mn, est assez petit. 

Nous allons étudier quelques exemples pour utiliser les métho- 
des exposées ci-dessus. 


Exemple 1. Soit dans le plan un segment de longueur ! (fig. 10.1.1) 
tournant d’une manière aléatoire de telle sorte que toutes les directions sont 


Fig. 10.1.1 Fig. 10.1.2 


équiprobables. Le segment est projeté sur un axe immobile AB. Trouver la 
valeur moyenne de la longueur de la projection du segment. 
Solution. La longueur de la projection est égale à: 


Y = l|cosal|. 


l'angle & est une variable aléatoire uniformément répartie sur l’interval- 
e 0, 21. 
La formule (10.1.5) donne: 


EL 
2x de ie 
m = M{l|cos al] = ( llcosa|2e = + | cosa de = 
0 Ô 
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Exemple 2. Une barre, pouvant être schématisée pe un segment 
de longueur !, vole en tournant autour de son centre de masse de telle sorte que 
toutes ses orientations dans l’espace sont équiprobables. Sur son chemin la 
barre rencontre un écran plan perpendiculaire à la direction de son mouvement 
et y laisse un trou. Trouver l’espérance mathématique de la longueur de ce trou. 

Solution. Nous allons tout d'abord donner la forme mathématique 
à l’assertion « toutes les orientations d’une barre dans l’espace sont équiproba- 


bles +. La direction du segment / sera caractérisée par le vecteur unitaire r 
(fig. 10.1.2), dont l'orientation dans le système de coordonnées sphériques lié 
au plan P de projection est donnée par deux angles: 6 dans le plan P et ç dans 


le plan perpendiculaire au plan P. Toutes les orientations du vecteur Tr étant 
équiprobables, toutes les positions de son extrémité sur la surface de la sphère 
S de rayon unité doivent avoir une même densité de probabilité; par consé- 
quent l'élément de probabilité 

{ (6, q) d6de, 


où f (6, œ) est la densité de probabilité conjointe des angles 6, , doit être 
proportionnel à la surface élémentaire ds sur la sphère S égale à: 


ds = dôdç cos œ, 
d'où : 
f (6, p) d6dq = À cos qdôdp; f (6, q) = À cos y, 

A étant un coefficient de proportionnalité. 
La valeur du coefficient À se trouve à partir de la relation: 


# 
2 
| de œ) d6 dp=1, 


d'où \ 
A=— e 
Ainsi, la densité de probabilité des angles 6, @ est donnée par la formule: 
i 0<8<2n, 
f (6, P)= 7 cos p pour À 5 < <+_. (10.41.15) 


[eos le segment ! sur le plan P, la longueur de la projection Ÿ est 
e à: 


Y = l'cos q. 


Considérant Ÿ comme une fonction des deux arguments 6 et o, on obtient 
à partir de la formule (10.1.7): 


x x 

| 2x 2 2 
my=Mllcsgl=z— | d | cos? p dp:= cos? qd = + 0,785. 

0 7 

T° 2 


Ainsi, la longueur moyenne du trou laissé par la barre dans {’écran est 
égale à 0,785 de sa longueur. 

Exemple 3. Une figure plane d'aire S tourne d’une manière désor- 
donnée dans l’espace de telle sorte que toutes ses orientations sont équiprobables. 
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Trouver l'aire moyenne de la projection de la figure S sur un plan immobile P 
(fig. 10.1.3). 


Solution. Convenons de caractériser l'orientation de la figure S 


dans l’espace par la direction de sa normale N. Tout comme dans le problème 
précédent on utilisera un système de coordonnées sphériques lié au plan P. 


La direction de la normale N à la figure S sera caractérisée par les angles 
aléatoires 6 et p répartis avec la densité (10.1.5). L'aire Z de la projection 
de la figure S sur le plan P est égale à: 


z=s | cos ( e) =s | sin y | 


et l'aire moyenne de la projection est: 
m=M{S]\sinp|] — 
A 
4x 2 


2 
S ; S 
= Le | cos p | sin p|dp=--. 
RL 
2 


Ainsi, l'aire moyenne de la projection d'une 
figure plane orientée d’une façon quelconque dans 
l'espace est égale à la moitié de la surface de cette 

Fig. 10.1.3 figure. nr” 
Exemple 4. Lors de la poursuite d'un 
certain objectif par un radar, l'écho représentant 
cet obiectif reste tout le temps sur l'écran. L'écran est un cercle C de 
rayon R. L'écho occupe sur l'écran une position aléatoire avec une densité de 
pots constante. Trouver la distance moyenne de l'écho au centre de 
"écran. 


Solution. Désignant par D la distance cherchée on a D — V/X3 + Yyi, 
où X, Ÿ sont les coordonnées de l'écho; de plus on a f (x, y) — 5 dans les 


limites du cercle C et f (x, y) = 0 à l'extérieur de ce cercle. En utilisant la for- 
mule (10.1.7) et en passant dans l'intégrale aux coordonnées polaires, on ob- 
tient : 


2x R 
1 —— 1 2 
MD —R2 [. Vr+yf ds dy ap | r2 dr = À. 


(K) 0 


Exem ? le 5. La fiabilité (ponaDines de fonctionnement sans défail- 
lance) d’un dispositif technique ç un régulateur) est une certaine fonction 
p (X, Y, Z) de trois paramètres. Les paramètres X, Y, Z sont des variables 
aléatoires de densité de probabilité conjointe donnée f (zx, y, z). Trouver la 
valeur moyenne (espérance mathématique) de la fiabilité du dispositif et l'écart 
quadratique moyen caractérisant sa stabilité. 

Solution. La fiabilité du dispositif p (X, Ÿ, Z) étant une fonction 
de trois variables aléatoires (paramètres) X, Ÿ, Z, sa valeur moyenne (espérance 
mathématique) sera donnée par la formule (10.1.8): 


m=MPGAY, Die | À À pts vs 2)f (2 v, 5) de dy ds. (40.146) 


10.1] ESPÉRANCE MATHÉMATIQUE. VARIANCE 207 
La formule (10.1.14) donne: 
Dp=Dip(X,Y,2i= À À À v, 210 y, 5) de dy di ms, 


o= VD, 

La formule (10.1.16) exprimant la probabilité moyenne (totale) 
de fonctionnement sans défaillance d'un dispositif compte tenu des 
grandeurs aléatoires dont dépend cette probabilité dans chaque cas, 
est un cas particulier de La formule intégrale de la probabilité totale 
généralisant la formule de la probabilité totale au cas d'un nombre 
infini (indénombrable) d'hypothèses. 

Nous allons démontrer cette formule sous une forme générale. 

Supposons que l'expérience dans laquelle apparaît l'événement 
A nous intéressant ait lieu dans des conditions aléatoires inconnues 
d'avance. Supposons que ces conditions soient caractérisées par des 
variables aléatoires continues 


X:, X2, e + 7 Xh (10.1.17) 
dont la densité de probabilité est : 
f (x, Lo, Zz,): 


La probabilité P, d'apparition de l'événement À est une certaine 
fonction des variables aléatoires (10.1.17): 


PA (Xi Xe, Xn). (10.1.18) 


Il y a lieu de trouver la valeur moyenne de cette probabilité 
ou en «d'autres termes la probabilité de l'événement À : 


P, = MIP, (Xi, Xa, ..., X,)l. 


< 


En utilisant la formule (10.1.8) donnant l'espérance mathémati- 
que d’une fonction on a: 


P 1 = ff ne Ÿ Pa Los +.) Tn) f(Ly, Lo, -.., Tn) AXy dTs . .. dr. 


où (10.1.19) 


La formule (10.1.19) porte le nom de formule intégrale de la pro- 
babilité totale. Il est facile de voir que de par sa structure elle est 
analogue à celle de la probabilité totale ; en effet, il suffit de rempla- 
cer la suite discrète d'hypothèses par une gamme continue, la somme 
par une intégrale, la probabilité d'une hypothèse par un élément de 
probabilite 

f (x, Lo, Th) dr; do, _. dx. 


et la probabilité conditionnelle d’un événement pour une hypothèse 
donnée par la probabilité conditionnelle de l'événement pour des 
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valeurs fixes des grandeurs aléatoires : 


Pa (ti Ta -.. 2). 


Souvent on utilise également la formule intégrale de l'espérance 
mathématique totale. Cette formule exprime l'espérance mathémati- 
que moyenne (totale) de la valeur qui sera prise par la variable aléa- 
toire Z dans l'expérience dont les conditions sont inconnues d'avance 
(aléatoires). Si ces conditions sont caractérisées par des variables 
aléatoires continues 

X1, X2, 1 Xh 


de densité de probabilité 


Î (z, T2, Zn), 
l'espérance mathématique de Z est une fonction des variables X;, 


PCR, 
m ; (Xi, X>2, 7 Xh); 


alors l’espérance mathématique totale de Z est donnée par la formule : 


m, = f + Î ma (rs, 23, sm) (liste, ce Ti) did 4 AZ; 


n (10.1.20) 
appelée formule intégrale de l'espérance mathématique totale. 


Exemple 6. L’ espérance mathématique de la distance D où l'objectif 
sera détecté Déc quatre stations radar dépend de certains paramètres techniques 
de ces stations, soit : 

X1 X2; X 3 Xe 


qui sont des variables aléatoires indépendantes de densité de probabilité 
Î (Zis Zas Zas 26) = fa (21) fa (2) fs (æs) fa (ie 


Pour des valeurs données des paramètres X, — x, X2 — 22, Xs — 23, 
X, = 74, l'espérance mathématique de la distance de détection est égale à: 
Mp (Zi Z2o Zas Zi). 


Trouver l'espérance mathématique moyenne (totale) de la distance de détection. 
Solution. La formule (10.1.20) donne: 


mp = j | il | mp (rs Ta a, 20) fa (xs) fa (æ2) fa (xs) fa (ra) dr1 des dr ds4. 


10.2. Théorèmes sur les caractéristiques 
numériques 


Dans le paragraphe précédent nous avons établi les formules per- 
mettant de trouver les caractéristiques numériques des fonctions 
lorsque les lois de répartition des arguments sont données. Cependant, 
souvent pour trouver les caractéristiques numériques des fonctions 
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il n’est pas indispensable de connaître les lois de répartition des argu- 
ments, il suffit d'en connaître certaines caractéristiques numériques ; 
dans ce cas on peut ignorer la loi de répartition. Le calcul des carac- 
téristiques numériques des fonctions d’après celles des arguments 
est fréquemment utilisé en théorie des probabilités, simplifiant 
beaucoup la solution de nombreux problèmes. Ces méthodes sont 
principalement employées dans le cas des fonctions linéaires ; cepen- 
dant certaines fonctions élémentaires non linéaires peuvent 
également être traitées. 

Dans le présent paragraphe nous allons exposer des théorèmes 
sur les caractéristiques numériques des fonctions, qui, dans leur en- 
semble, forment un appareil assez simple de calcul des caractéristiques 
ayant un large champ d'application. 


1. Espérance mathématique d'une variable non aléatoire 
Si c est une variable non aléatoire on a: 
M lel = c. 


Cette propriété est int ‘itivement évider..e ; pour la démontrer on 
peut considérer la variak.s non aléatoire c comme un cas particulier 
des variables aléatoires, prenant sa seule valeur possible avec la pro- 
babilité unité : 


Mldldl=cAi=ce. 


2. Variance d'une variable non aléatoire 
Si c est une variable non aléatoire on a: 


D {cl = 0. 
Démonstration. Par définition de la variance: 


Di =M{c})=M [(c—me)] = M [(c—c)] = M (0) =0. 


3. Mise en facteur d'une variable non aléatoire devant 


Le signe de l'espérance mathématique 
Si c est une variable non aléatoire et X une variable aléatoire on a: 
M lcX] = cM IX, (10.2.1) 


c'est-à-dire qu'une variable non aléatoire peut être mise en facteur de- 
vant le signe de l'espérance mathématique. 


14—2823 
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Démonstration. 
a) Pour les variables discrètes : 


MIcX]= Deripi =C 2 zipi=cM IX]. 


b) Pour les variables continues : 


M [cX] = f crxf(x)dr =c Î zf(z)dz=cM[X]. 


4. Mise en facteur d'une grandeur non aléatoire 
devant le signe de la. variance 
et de l'écart quadratique moyen 
Si cest une variable non aléatoire et X une variable aléatoire on a: 
D {cX] = D [XI], (10.2.2) 


c'est-à-dire qu'une variable non aléatoire ‘peut être mise en facteur 
devant le signe de la variance à condition de l'élever au carré. 
Démonstration. Par définition de la variance on a: 


DIcX]=MI(cX—M [cX]}] — 
= M [(cX—cm:)] = CM [(X—1m.)] = D [X]. 


Corollaire 
o [cX] = lc|olX], 


c'est-à-dire qu'on peut mettre en facteur devant le signe de l'écart 
quadratique moyen une variable non aléatoire en valeur absolue. 
Pour la démonstration il y a lieu d'extraire la racine carrée de l’ex- 
pression (10.2.2), tenant compte du fait que l'écart quadratique 
moyen est une grandeur essentiellement positive. 


5. Espérance mathématique d'une somme 
de variables aléatoires 


Nous allons montrer que pour deux variables aléatoires quelcon- 
ques X et Yon a: 


MIX +Y1 = M IX] + M lY1i, (10.2.3) 


c'est-à-dire que l'espérance mathématique d’une somme de deux variables 
aléatoires est égale à la somme de leurs espérances mathématiques. 

Cette propriété est connue sous le nom de théorème d'addition des 
espérances mathématiques. 

Démonstration. 

a) Soit (X, Ÿ) un système de variables aléatoires discrètes. Nous 
allons appliquer à leur somme la formule générale (10.1.6) donnant 
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l'espérance mathématique d’une fonction de deux arguments: 
MIX+Y]= 2 2 (ci + y5) Puy = 2 2 ZiPi9 + 2 2 Y3Puy = 


= 2e 2 pu+ Zu Du. 
{ j { 


Mais 2} psy n'est rien d'autre que la probabilité totale pour X 
de prendre la valeur zx, : 
Dpu=P(X=z)= pi; 
par conséquent : 
2 Zi D Pu= 2 zipi = MX]. 
D'une manière analogue on peut montrer que 


DZ 2 Puy =M\Y1, 


ce qui achève la démonstration. 
b) Soit (X, Y) un système de variables aléatoires continues. En 
vertu de la formule (10.1.7) on a: 


MIX+YI= | [(e+y)f(a, v)dr dy = 


= (za vardy+ | Üuf(z,vardy. (10.24) 
La première des intégrales (10.2.4) peut s'écrire comme suit: 


(f zf (x, y) dx dy = ( z | [ f(x, y) dy} dr = [ zf(z) dc = MIX]; 


d’une manière analogue on a: 
[ L'uf(e yazdy= MY), 


le théorème se trouve ainsi démontré. 

Il y a lieu de noter spécialement que le théorème d'addition des 
espérances mathématiques est indifférent à la corrélation des varia- 
bles aléatoires, étant vrai tant pour des variables indépendantes que 
liées. 


14° 
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Ce théorème peut être généralisé à un nombre quelconque de ter- 
mes : 
n n 
M [2 Xi) = 2 MIX1, (10.2.5) 


c’est-à-dire que l'espérance mathématique de la somme de plusieurs 
variables aléatoires est égale à la somme de leurs espérances mathémati- 


Pour la démonstration il suffit de procéder par récurrence. 


6. Espérance mathématique d'une fonction linéaire 
Considérons une fonction linéaire de plusieurs arguments aléatoi- 
res X:, X>, 9 D, a 
à aiX:1 + b, 
où a, b sont des coefficients non aléatoires. Nous allons démontrer 
que 
M [2 aX: “+ b] = D aiM [Xi] + b, (10.2.6) 


Îi= 


C2 


c'est-à-dire que l'espérance mathématique d'une fonction linéaire 
est égale à cette même fonction linéaire des espérances mathémati- 


ques des arguments. 

Démonstration. Appliquant le théorème d’addition des 
espérances mathématiques et mettant en facteur la variable non 
aléatoire devant le signe de l’espérance mathématique on a: 


MID œXi+b]=MIS «Xi + M (b] = 
imi i=i 
= 2 M {aiXi] +b= 2 aiM {X1] + b. 
7. Variance de la somme de variables aléatoires 


La variance de la somme de deux variables aléatoires est égale 
à la somme de leurs variances à laquelle s’ajoute la double covariance : 


DIX +Y]= DIX] + D [T7] +2K,;. 1(10.2.7) 
Démonstration. Notons: 
Z=X+TY. ] (10.2.8) 


En vertu du théorème d'addition des espérances mathématiques 


on a: 
My = Max + My. (10.2.9) 
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Passons des variables X, Y, Z aux variables centrées correspon- 
dantes X, Y, Z. En retranchant membre à membre l’égalité (10.2.9) 
de l'égalité (10.2.8) on a: 

Z2=X+)Y. 
Par définition de la fvariance 
DIX+Y]=D1IZ1=M1(21= MIX] +2MIXŸI+ 
+M(Ÿ=D(X]+2K:y+ DIT], 


ce qu’il fallait démontrer. 
La formule (10.2.7) pour la variance peut être généralisée à un 
nombre quelconque de termes, soit : 


DIX Xl = À DIXI1+2 2 Ki, (10.2.10) 
{= 1 mi i<; 


où X};, est la covariance des variables X;, X;; la notation i < j 
sous le signe Z désigne que la sommation s'étend à toutes les combinai- 
sons possibles deux à deux des variables aléatoires (X;,, X2, . .., X,). 
La démonstration est analogue à celle donnée précédemment et 
découle de la formule du carré d’un polynôme. 
On peut écrire la formule (10.2.10) différemment, soit : 
n Li n 
D [2 Xi] = à à Ki, (10.2.11) 
îi= ui j= 
où la double somme s'étend à tous les éléments de la matrice de va- 
riances-covariances du système (X:, X2, ..., À). 
Si toutes les variables aléatoires (X:, X2, . .., X,) du système 
ne sont pas corrélées deux à deux (ce qui signifie que K;y — 0 pour 
i = j), la formule (10.2.10) devient : 


DID X:]= >» DIX1, (10.2.12) 
m1 {m1 
c'est-à-dire que la variance de la somme de variables aléatoires non 


corrélées est égale à la somme des variances des composantes. 
Cette règle est dite théorème d’addition des variances. 


8. Variance d'une fonction linéaire 


Considérons une fonction linéaire de plusieurs variables aléatoires 
D uXi+b, 
im! 


où a, b sont des grandeurs non aléatoires. 
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Nous allons démontrer que la variance de cette fonction linéaire 
est donnée par la formule: 


DIZ &xX +b] = À a? D [X:] +2 Zumku (10.2.13) 


où K,, est la covariance des variables aléatoires X,, X};. 
Démonstration. Notons: 


Yi = aÂi, 
on a alors: 
Zuxkitb= DYi+b. (10.2.14) 


En appliquant au second membre de l’expression (10.2.14) 
la formule (10.2.10) et vu que D [b] = 0, on a: 


DID aXi+6]= D DIYI+2 X Kÿy = 
{mi {1 1<j 


= >; ai DIX]+2 Ki, (10.2.15) 
{us 1 1<j 
Kf° est ici la covariance des variables Y,, Ÿ , donnée par la formule: 
Kw = M YŸ 3]. 
Calculons cette quantité: 
Vi Yi my, = Xi aime, = Xi; 
d'une manière analogue: 
Y; = aiX}, 
d'où 
Ki = M laayX1X;] —a;a;M XX] = d;a)K;j. 
En substituant cette expression dans (10.2.15) on aboutit à la 
formule (10.2.13). 


Dans le cas particulier où toutes les variables (X:, X2, ..., X:) 
ne sont pas corrélées la formule (10.2.13) devient : 


DIÈ aX1+b] =ù ai D [Xi], (10.2.16) 


c'est-à-dire que la variance d'une fonction linéaire de variables aléatoi- 
res non corrélées est égale à la somme des produits des carrés des coeffi- 
cients par les variances des arguments correspondants *). 


*) Des variables indépendantes étant toujours non corrélées, toutes les 
propriétés démontrées dans ce paragraphe pour les variables non corrélées 
seront également vraies pour les variables indépendantes. 
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9. Espérance mathématique du produit 
de variables aléatoires 


L'espérance mathématique du produit de deux variables aléatoi- 
res est égale au produit de leurs espérances mathématiques plus la 
covariance : 


MIXY]=MIX]MIY]+K.x. (10.2.17) 
Démonstration. Par définition de la covariance on a: 


Key=MIXŸY]=MI(X—m,)(Y —m)], 


m,= MIX); m, = M [1]. 


Transformons cette équation en faisant usage des propriétés de 
l'espérance mathématique: 


Key=M{(X—mx)(Y — my)] = 
= MIXY]—-mM{Y]—mM (X]— memy = MIXY) —M IX] M [Y], 


ce qui de toute évidence est équivalent à la formule (10.2.17). 
Si les variables aléatoires (X, Ÿ) ne sont pas corrélées (K,, = 0), 
la formule (10.2.17) devient: 


M IXY) = MIX] M [71], (10.2.18) 


c'est-à-dire que l'espérance mathématique du produit de deux variables 
aléatoires non corrélées est égale au produit de leurs espérances mathé- 


Cette formule est connue sous le nom de théorème de multiplica- 
tion des espérances mathématiques. 

La formule (10.2.17) n’est rien d’autre que l’expression du second 
moment mixte centré du système exprimé en fonction du second 
moment mixte initial et des espérances mathématiques : 


Kay = Us = Lis — MxMy- (10.2.19) 


Cette expression est souvent utilisée pour le calcul du moment 
de corrélation, tout comme dans le cas d’une seule variable aléatoire 
la variance se calcule par le second moment initial et l'espérance 
mathématique. 

Le théorème de multiplication des espérances mathématiques 
peut être généralisé facilement au cas d’un nombre quelconque de 
facteurs, seulement pour l'appliquer il ne suffit plus que les variables 
soient non corrélées, il faut encore que certains moments mixtes 
d'ordre élevé s’annulent, le nombre de ces moments dépendant du 
nombre de termes figurant dans le produit. Ces conditions sont tou- 
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jours remplies lorsque les variables sont indépendantes. Dans ce cas 


M [I xd= Î] # 1x, (10.2.20) 


c'est-à-dire que l'espérance mathématique du produit de variables aléa- 
toires indépendantes est égale au produit de leurs espérances mathémati- 


Cette formule se démontre facilement par récurrence. 


10. Variance d'un produit de variables aléatoires 
indépendantes 


Nous allons démontrer la formule suivante pour les variables 
indépendantes X et Y : 


DIXY]=DIX]DIY]+mD[Y]+miD[X]. (40.2.21) 


Démonstration. Notons XŸY = Z; par définition de la 
variance on a: 


DIXY(—D(Z]=MIZ1=M(I(Z—m.)]. 
X et Ÿ étant indépendantes, on a m, = mm, et 
DIXY]=MI(XY—mem)] = M [X?Y"] —2m,m,M [XY] + mimi. 

T1 découle de l'indépendance de X et Y que X°, Y le sont égale- 

ment *);, par conséquent : 
MIXY?!]=MIX]MIY], MIXY]=mm, 
et 
DIXY]=MIX]MIY']—mm;. (10.2.22) 


Mais M ([X°] n'est rien d'autre que le second moment initial de X 
et par conséquent peut s'exprimer en fonction de la variance comme 
. MX] = DIX) + mi : 
d'une manière analogue on a: 
MIY*]=D{Y]+m. 
En substituant ces expressions dans la formule (10.2.22) et en 


réduisant les termes semblables on obtient la formule (10.2.21). 


*) On peut montrer que toutes fonctions de variables aléatoires indépen- 
dantes sont également indépendantes. 
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Dans le cas de multiplication de variables centrées (donc, 
ayant les espérances mathématiques nulles) la formule (10.2.21) 
devient : 


D{XŸ]=-D[X1D(Ÿ], (10.2.23) 


c'est-à-dire que La variance du produit de variables aléatoires indépen- 
dantes centrées est égale au produit de leurs variances. 


11. Moments d'ordre supérieur d'une somme 
de variables aléatoires 


Il y a parfois lieu de calculer les moments d'ordre supérieur d’une 
somme de variables aléatoires indépendantes. Nous allons démontrer 
certaines relations utiles. 

4) Si les variables aléatoires X, Y sont indépendantes on a: 


L3 [X + Y] = Us [X] + M3 [Y1]. (10.2.24) 


Démonstration. 


Us (A+ YI= MIX + —-m—m)] = M ({(X —m) + (Y —m,)}] = 
=MI(X—m3)] + 3M [(X— mx) (Y —m)] + 
+ SM ms) (Y —m)] + MI(Y —m)], 
d’où en vertu du théorème de multiplication des espérances mathé- 
matiques 
ds [X + Y] = ps [X] + 3pe [EX] ps [YT + pu [Y] pe EX] + ps [Y1. 
Le moment centré un u, pour une variable quelconque étant nul, 
les deux termes centraux de cette expression s’annulent, donc, la 
formule (10.2.24) se trouve démontrée. 
En procédant par récurrence on peut facilement généraliser la 


relation (10.2.24) au cas d’un nombre quelconque de variables aléatoi- 
res indépendantes : 


Us [2 Xi] = 2 Us [Xi]. (10.2.25) 


2) Le moment centré quatre d’une somme de deux variables aléa- 
toires indépendantes est donné par la formule: 


MIX +Y]=pIXI+ Yl+6D,D,,  (10.2.26) 


où D,, D, sont les variances de X et Y. 
La démonstration est analogue à celle du cas précédent. 
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On peut facilement généraliser par récurrence les formules 
(10.2.26) au cas d’un nombre quelconque de termes indépendants : 


MID X]=  miX]+6 D D:,D.;, (10.2.27) 
i=1 {mi 1<J 
Des relations analogues peuvent, s'il y a lieu, être démontrées 


pour les moments d'ordres plus élevés. 


12. Addition des vecteurs aléatoires non corrélés 


Soient dans le plan zOy deux vecteurs aléatoires non corré- 


lés: V, de composantes (X1, Y:) et V2 de composantes (X2, Y2) 
(fig. 10.2.1). 


Considérons leur somme vectorielle : 
V = V, + Va, 
c'est-à-dire le vecteur de composantes: 
X = X1 + X2, 
Y="Yi+ Ye. 
Il y a lieu de trouver les caractéristiques numériques suivantes du 


vecteur aléatoire Æ les espérances mathématiques m., m,, les varian- 
ces D,, D, et la covariance K... 
En vertu du théorème d’addition des espérances mathématiques 
on a: 
Mz = Max, + Max, » 


My = My, À My, 
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et en vertu du théorème d’addition des variances: 
D; — D», + D, , 
D, — D, D, 
Nous allons démontrer maintenant que les covariances s'ajoutent 
également, c'est-à-dire que 
K zu = zu, + Kx Z>V2° (10.2.28) 
OÙ Kxy Kxava sont les covariances des composantes de chacun des 
vecteurs V, et V. 
Démonstration. Par définition de la covariance on a 
Key =MIXŸ]= M (À: + X2) (Va + Ya)] = 
=MIXŸ1+MLXŸ + MIX Ye] + M Le 2l. (102.29) 


Les vecteurs V,, V2 étant non corrélés, les deux termes du milieu 
dans la formule (10.2.29) sont nuls ; les deux termes restants sont 
Kxy1 €t Kxsyas donc la formule (10. 2.28) se trouve démontrée. 

La formule (10.2.28) est parfois appelée « théorème d'’addition 
des covariances ». 

Ce théorème peut facilement être généralisé au cas d'un nombre 
quelconque de termes. Soient deux systèmes de variables nn 
non corrélées, c'est-à-dire deux vecteurs aléatoires non corrélés à 
dimensions : 

X de composantes X1, X2, ..., Xn, 


Ÿ de composantes Ÿ1, Y2, ..., Ÿa, 
la matrice de corrélation de la somme vectorielle : 
Z=X+Y 
a pour éléments les sommes des éléments des matrices de corrélation 
des composantes : 


Kf? = K!? + K;}, (10.2.30) 


où K(?, Kf, K() sont issus les covariances des variables 


(Z4, Z;): (Xi, X3)5 Pr Yi). 
La formule (10. 2. 30) est vraie tant pour i — j que pour i£ j. 


En effet, les composantes du vecteur Z sont: 
Zi = Xi + Ÿ:; 
22 = À u F2 ; 


Z=X+Y 
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En vertu du théorème d’addition des variances : 
D:, D;, + D,,, 


ou, en utilisant des notations différentes : 
H=RGA+KY . 
En vertu de théorème d’addition des covariances pour i -£ j on a: 
KP = KE +KY. 


En mathématiques on appelle somme de deux matrices la matrice dont 
les éléments sont obtenus par addition des éléments correspondants 
de ces matrices. En utilisant cette terminologie on peut dire que la 
matrice de corrélation de la somme de deux vecteurs aléatoires non 
corrélés est égale à la somme des matrices de corrélation des compo- 


santes : 
KES = AE + KP 1 (10.2.31) 


Par analogie avec les cas précédents on appelle cette règle « théo- 
rème d’addition des matrices de corrélation ». 


10.3. Applications des théorèmes sur 
les caractéristiques numériques 


Dans ce paragraphe nous allons montrer comment on peut utiliser 
l'appareil des caractéristiques numériques à la résolution d’un cer- 
tain nombre de problèmes. Certains de ces problèmes présentent un 
intérêt théorique par eux-mêmes et seront utilisés dans la suite; 
d’autres problèmes ne sont donnés qu’à titre d'exemple. 

Problème 1. Coefficient de corrélation 
de variables aléatoires à dépendance li- 
néaire. 

Montrer que si les variables aléatoires À et Y sont liées par une 
relation fonctionnelle linéaire 


Y =aX + b, 


leur coefficient de corrélation est égal à “+ 1 ou —1, suivant le signe 
du coefficient a. 
Solution. On a: 


Kru=MIXŸ]=MI(X—m:)(Y—m)] = 
= M[(X—m,;)(aX +b—am,—b)] =aM [(X— mx) ] =aD,, 


où D, est la variance de X. 


10.3] APPLICATIONS DES THÉORÈMES 224 


Ecrivons l'expression du coefficient de corrélation : 
Key 
lxy 0:07 * (10.3.1) 


Pour calculer o, on recherche la variance de Y : 
D,=D{aX +b] =aD,, 
Oy—=|a | Oxe 
La substitution dans la formule (10.3.1) donne: 
nn eue = 
*V" Jalox Îel° 
La grandeur ral est égale à +1 lorsque a est positif et à —1 lors- 
que a est négatif, c’est ce qu'il fallait démontrer. 
Problème 2 Limites du coefficient de 


corrélation. 
Montrer que pour des variables aléatoires quelconques on a: 


LAAEST 
Solution. Soit la variable aléatoire 
Z=0,Â +0,)Ÿ, 


où ©,, ©, sont les écarts quadratiques moyens de X et Y. Nous allons 
calculer la variance de Z. Selon la formule (10.2.13) on a : 
D, =0},D,+02D, + 20,0 ,Ky 
ou : 
D, = 2030; + 20,0,K:y- 
La variance d’une variable aléatoire quelconque ne pouvant 
être négative, on a: 
20:07 + 20,0/yKxy > 0, 
ou 
Ox0y E Xp >0, 
d'où : 
| Key | < OxO y 
par conséquent : 
[rayl 1, 
ce qu'il fallait démontrer. 
Problème 3 Projection d'un point aléa- 
toire dun plan sur une droite quelconque. 
Soit un point aléatoire de coordonnées (X, Ÿ) dans un plan 


(fig. 10.3.1). Projetons ce point sur l’axe Oz menée par l’origine des 
coordonnées et faisant avec l'axe Ox un angle &. La projection du 
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point (X, Ÿ) sur l’axe Oz est également un point aléatoire ; sa distan- 
ce Z à l'origine des coordonnées est une variable aléatoire. Trouver 
l'espérance mathématique et la variance de Z. 

Solution. On a: 


Z = X cos a + Y sin «. 
Z étant une fonction linéaire des arguments X et Y, 
Ms = My COS & + My Sin; 
D, = D, cos’ a + D, sin° a + 2K,, sin a cos « — 
= D, cos’ a + D, sin*a + K,., sin 24, 
D,, D,y, Kzy étant respectivement les variances et la covariance des 
variables (X, Y). 


Fig. 10.3.1 


En passant aux écarts quadratiques moyens on a: 
0? — 02 cos? a + 04 sin? à + r:y0:0y Sin 2&. (10.3.2) 


Dans le cas de variables aléatoires non corrélées (pour r,, = 0) 
on obtient: 
07 — 0% cos? & + 0, sin? &. (10.3.3) 


Problème 4 Espérance mathématique du 
uombre de réalisation d'un événement dans 
plusieurs expériences. 

Supposons qu’on effectue x expériences, dans chacune desquelles 
l'événement À peut apparaître ou ne pas apparaître. La probabilité 
de réalisation de l'événement À dans l’i-ème expérience est égale 
à p1. Trouver l'espérance mathématique du nombre de réalisations 
de l'événement. 

Solution. Soit X la variable aléatoire discrète représentant 
le nombre de réalisations de l'événement dans toute la série d'expé- 
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riences. Il est évident que: 
X = Xi+ Xs+t ... + Xn, 
ou plus brièvement : 


X= Ÿ X4, 
{mi 


où ZX, est le nombre de réalisations de l'événement À dans l'i-ème 
expérience ; à = 4, ...,n. 

Chacun des nombres X’, est une variable aléatoire discrète pou- 
vant prendre l’une des deux valeurs 0 et 1. Le tableau de répartition 
de X 1 est : 

0|1 


q|p:” 


où gs = 1 — p, est la probabilité de non-réalisation de l'événement 
À dans l'i-ème expérience. 
En vertu du théorème d’addition des espérances mathématiques : 


mx = M (X] = 2 Ma (10.3.5) 


(10.3.4) 


où m., est l'espérance mathématique de X.. 
Calculons m.. Par définition de l'espérance mathématique on a: 


Mz, = 0-q+1-pi= pr. 
En substituant ce résultat dans la formule (10.3.5) on obtient: 


m= D pr (10.3.6) 


c'est-à-dire que l'espérance mathématique du nombre de réalisations 
d'un événement dans une série d'expériences est égale à la somme des 
probabilités de l'événement dans chaque expérience particulière. 
En particulier, lorsque les conditions des expériences sont les 
mêmes et 
Pi = P2—= .. — Pr — P; 


la formule (10.3.5) devient : 
My = ND. (10.3.7) 


Comme le théorème d’addition des esperances mathématiques 
est applicable à des variables aléatoires quelconques, tant dépendan- 
tes qu'indépendantes, les formules (10.3.6) et (10.3.7) sont indiffé- 
remment vraies pour des expériences liées et indépendantes. 

Le théorème démontré est souvent appliqué dans la théorie du tir, 
lorsqu'il y a lieu de trouver le nombre moyen d’atteintes pour plu- 
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sieurs coups, tant dépendants qu'indépendants. L’espérance mathé- 
matique du nombre d’atteintes pour plusieurs coups est égale à la somme 
des probabilités d'atteinte pour différents coups. 

Problème 5. Variance du nombre de réali- 
sations d'un événement dans plusieurs 
expériences indépendantes. 

On effectue n expériences indépendantes chacune desquelles peut 
réaliser ou ne pas réaliser l’événement À ; la probabilité de réalisa- 
tion de l'événement À dans l’i-ème expérience est égale à p4. Trou- 
ver la variance et l'écart quadratique moyen du nombre de réalisa- 
tions de l'événement À. 

Solution. Considérons la variable aléatoire X représentant 
le nombre de réalisations de l'événement À, que nous écrirons comme 
dans le problème précédent comme la somme 


X= D X:, 
i=1{ 


où X, est le nombre de réalisations de l'événement À dans l'i-ème 
expérience. 

Les expériences étant indépendantes, les variables aléatoires X,, 
X2, ..., X, le sont également et on peut leur appliquer le théorème 
d'addition des variances: 


D, = 2 Ds; 
Calculer maintenant la variance de X;. Le tableau de répartition 
(10.3.4) donne : 
Ds, =(0— pi) gs + (1 — pi) pa = pigi, 
d'où 


D.= 2 Pit, (10.3.8) 


c'est-à-dire que La variance du nombre d'apparitions d'un événement 
dans plusieurs expériences indépendantes est égale à la somme des produits 
des probabilités de réalisation et de non-réalisation de l'événement dans 
chacune des expériences. 

La formule (10.3.8) donne l’écart quadratique moyen du nombre 
de réalisations de l'événement À : 


OL = VE Pii- (10.3.9) 


Pour des conditions d'expériences constantes, lorsque 
Pi = P2 = ... — Pn —p, les formules (10.3.8) et (10.3.9) se 
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simplifient et on a: 


D.=— np, 
bé ; (10.3.10) 


Ox = V np. 


Problème 6. Variance du nombre d'appa- 
ritions d’un événement dans une série 
d'expériences dépendantes. 

Soient nr expériences dépendantes pouvant réaliser ou ne pas réa- 
liser chacune l'événement À ; la probabilité de cet événement dans 
l'ième expérience est égale à p, (i = 1, 2, ..., n). Trouver la 
variance du nombre de réalisations de cet événement. 

Solution. Pour résoudre le problème posé nous allons de 
nouveau écrire le nombre de réalisations de l'événement À comme la 
somme : 


n 
X= D x, (10.3.11) 
{= 1 
où 
x 1, si l'événement À a été réalisé par l'i-ème expérience, 
ê = 


0, si l'événement À n’a pas été réalisé par l’i-ème expérience. 
Les expériences n'étant pas indépendantes, il ne suffit plus de 
connaître les probabilités 
Pis P2» ° ++ Pn 


de réalisation de l'événement À par la première, la seconde, la troi- 
sième, etc. expérience. Il faut de plus se donner la manière dont les 
expériences dépendent les unes des autres. Il se trouve que pour 
résoudre ce problème il suffit de connaître la probabilité P,; de réali- 
sation conjointe de l'événement À tant dans l'i-ème que la j-ième 
expérience ; P ((X: = 1) (ZX; = 1)) = P:,. Supposons que cette pro- 
babilité soit donnée. Nous allons appliquer à l'expression (10.3.11) 
le théorème d’addition des variances [formule (10.2.10)] : 


D,= D D, +2 Ki, (10.3.12) 
i=! 1€) 
où X,, est la covariance de X, et X;,: 
Kuy=MI[XiX)]. 
La formule (10.2.19) donne : 
Ki5=MIXiX;] — Me Mx, = M {XiX 5] — piPs- (10.3.13) 


Considérons la variable aléatoire X,X};. Il est évident qu'elle 
est égale à zéro si l’une des variables X,, X, est égale à zéro, c'est- 
à-dire si au moins l’une des expériences (l'i-ème ou la j-ième) n’a 


15—2823 
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pas réalisé l'événement À. Pour que la quantité X,X, soit égale 
à l'unité il faut que l'événement À apparaisse dans les deux expérien- 
ces. Cette probabilité est égale à P,;. Par conséquent 


M{XiX;] = Pi 
et 
Ki5 = Pi — pipi. 


En substituant cette expression dans la formule (10.3.12) on ob 
tient : 


D,= 2, pgu+2 D (Piy— pipi). (10.3.14) 
1= 1 1<J 


, La formule (10.3.14) donne la variance du nombre de réalisations 
de l’événement dans des expériences dépendantes. Le premier terme 
du second membre est la variance du nombre de réalisations de 
l'événement dans les expériences indépendantes, et le second, la cor- 
rection due à la dépendance des expériences. Si la probabilité P;; 
est égale à p:p1, cette correction est égale à zéro. Si la probabilité 
P;, est supérieure à p:p,, ceci signifie que la probabilité conditionnel- 
le de réalisation de l'événement À par la j-ième expérience à condi- 
tion que l’i-ème expérience l’a réalisé, est supérieure à la probabilité 
simple p; (inconditionnelle) de réalisation de l'événement dans 
la j-ème expérience (entre les réalisations de l'événement dans 
l'i-ième et la j-ième expérience il y a une corrélation positive). S'il 
en est ainsi pour tout couple d'expériences, le terme correcteur dans la 
formule (10.3.14) est positif et la variance du nombre de réalisations 
de l'événement dans des expériences dépendantes est supérieure à la 
variance dans le cas des expériences indépendantes. 

Si la probabilité P;; est inférieure à p;p, (entre les réalisations de 
l'événement dans l’i-ème et la j-ième expérience il y a une corréla- 
tion négative), le terme correspondant est négatif. S'il en est ainsi 
pour tout couple d'expériences, la variance du nombre de réalisations 
de l’événement dans des expériences dépendantes est inférieure à la 
variance dans le cas des expériences indépendantes. 

Considérons le cas particulier où py = Ps = ... = Ph —p; 
Pis = Pi2 = ...—=P, c'est-à-dire que les conditions de toutes les 
expériences sont les mêmes. La formule (10.3.14) devient alors: 


D,=npg +2 2 (P—p?)=npq+n(n—1)(P—pt}), (10.3.15) 


où P est la probabilité conjointe de réalisation de l'événement À 
dans deux quelconques expériences. 

Deux cas particuliers sont intéressants : 

1. La réalisation de l'événement À par n'importe laquelle des 
expériences entraîne obligatoirement sa réalisation par toutes les 
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autres expériences. On a alors P = p et la formule (10.3.15) devient : 
D,=npg+n(n—1)(p—p*)=np+n(n—1) pq =n"pg. 


2. La réalisation de l'événement À par une expérience quelcon- 
que rend impossible sa réalisation par toutes les autres expériences. 
On a alors P = 0 et la formule (10.3.15) devient : 


D,=npg—n(n—1) pP=nplg—(r—1)p] =np(1—np). 


Problème 7. Espérance mathématique du 
nombre d'unités mises à un état donné. 

Dans les applications pratiques on a souvent à résoudre le pro- 
blème suivant. Un certain groupe est forme de nr unités sur lesquelles 
on exerce uné certaine action. Par suite de cette action chacune des 
unités peut se trouver dans un certain état S. La probabilité pour 
l'i-ème unité de se trouver dans l’état S est égale à p.. Trouver l’espé- 
rance mathématique du nombre d'unités qui, par suite de l’action sur 
tout le groupe, se trouveront dans l’état S. 

Solution. Faisons correspondre à chacune des unités la 
variable aléatoire X, pouvant prendre les valeurs 0 et 1: 


X, = 1 si l’i-ème unité se trouve dans l'état S ; 
1 — À O si l’i-ème unité n'est pas dans l'état S. 


Soit X le nombre d'unités mises à l’état S, il est évident que 
X= Ÿ X1:. 


En vertu du théorème d’addition des espérances mathématiques 
on a: 


ñn 
My = ÿ Max. 
1==1 


L'espérance mathématique de chacune des variables X, est connue 
et égale à : 


Mz, = Pt. 
Par conséquent : 
M = à Pis (10.3.16) 


c'est-à-dire que l'espérance mathématique du nombre d'unités mises 
à l’état S est égale à la somme des probabilités de réduction à cet 
état de chacune des unités. 

Notons que pour être vraie la formule démontrée n'’exige obliga- 
toirement pas que les unités passent à l’état S indépendamment les 
unes des autres. De plus, la formule est vraie pour n'importe quel 
genre d'action. 

15° 
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Problème 8& Variance du nombre d'unités 
mises à un état donné. 

Si pour les conditions du problème précédent la réduction de 
chacune des unités à l’état S se produit indépendamment de toutes 
les autres, le théorème d’addition des variances, appliqué à la quan- 
tité 


X = ÿ Xi, 
i=1 


donne la variance du nombre d'unités mises à l’état S : 


D. = à D, = 2 Piqt; qi = 1 — Di: (10.3.17) 


Par contre, si l’act:on sur les unités est telle que le passage 
à l’état S pour certaines unités se réalise conjointement, la variance 
du nombre d'unités mises à l’état S s'exprime par la formule suivan- 
te (cf. formule 10.3.14): 


D, = à pigi +2 2 (Pay — pips), (10.3.18) 
i= 1 


où P;, est la probabilité pour les unités i et j de passer conjointement 
à l'état S à la suite d’une certaine action. 

Problème 9. Espérance mathématique du 
nombre d'expériences avant la kième appa- 
rition de l'événement. 

Soient une série d'expériences indépendantes dans chacune des- 
quelles l’événement À peut apparaître ou ne pas apparaître avec une 
probabilité p. Les expériences durent tant que l'événement À n’ap- 
paraisse k fois, puis les expériences sont arrêtées. Trouver l’espéran- 
ce mathématique, la variance et l'écart quadratique moyen du nom- 
bre d'expériences À qui seront éventuellement effectuées. 

Solution. Dans l'exemple 3 du $ 5.7 on a trouvé l’espé- 
rance mathématique et la variance du nombre d'expériences précé- 
dant la première réalisation de l'événement À : 


m = : ? D = +. , 
P P 
où p est la probabilité de réalisation de l’événement dans l’une des 
expériences, 


qg = 1 — p la probabilité de sa non-réalisation. 

Considérons la variable aléatoire X représentant le nombre d’ex- 
périences précédant la réalisation de l'événement À. Elle peut s'écri- 
re comme la somme : 


X = Xi+Â2+... + An, 
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où ZX, est le nombre d'expériences précédant la première réalisation 
de l'événement À, 
X2, le nombre d'expériences séparant la première et la seconde 
réalisation de l'événement À (seconde réalisation incluse), 


X», le nombre d'expériences séparant la (k — 1)-ième et la 
k-ième réalisation de l'événement À (k-ième réalisation 
incluse). 

Il est évident que les variables X,, X>, . .., X, sont indé- 
pendantes et sont réparties toutes suivant la même loi que X, (nombre 
d'expériences précédant la première réalisation de l’événement), les 
caractéristiques numériques de cette loi étant 

L: q 
Max, = D? ’ D. TT p2 . 
Les théorèmes d’addition des espérances mathématiques et des va- 
riances donnent : 


Mz = D. Mz, à : 
ii 
R 
D,= SD. = (10.3.19) 
i=1 
Or = kg : 
P 


Problème 10. Dépenses moyennes avant 
d'atteindre un certain résultat. 

Dans le problème précédent nous avons envisagé le cas où une 
série d'expériences est entreprise dans le but d'atteindre un certain 
résultat — À réalisations de l'événement À, qui dans chaque expé- 
rience a la même probabilité. Ce problème est un cas particulier d'un 
autre problème où une série d'expériences est effectuée dans le but 
d'atteindre un résultat quelconque B, dont la probabilité augmente 
avec le nombre d'expériences nr suivant une loi quelconque P (n). 
Supposons que chaque expérience coûte a. Trouver l'espérance mathé- 
matique des dépenses. 

Solution. Pour résoudre le problème posé on suppose que le 
nombre d’expériences n'est limité en rien et que celles-ci sont prolon- 
gées après avoir obtenu le résultat B. Certaines de ces expériences 
seront alors superflues. On dit qu’une expérience est nécessaire, si 
elle a lieu lorsque le résultat B n’est pas atteint, et superflue si elle 
a lieu lorsque le résultat B est déjà atteint. 

On fait correspondre à chaque i-ème expérience la quantité 
X 1, égale à zéro ou à l’unité suivant que cette expérience s’est trou- 
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vée être indispensable ou superflue. Posons donc 


x, = { 1si l'expérience s'est trouvée être indispensable ; 
0 si elle s’est trouvée être superflue. 


Considérons la variable aléatoire X représentant le nombre d’ex- 
périences à faire pour obtenir le résultat B. Il est évident qu’elle 
peut s’écrire comme la somme: 


RE CD CR D (10.3.20) 


Parmi les termes de la somme (10.3.20) le premier, X1, n'est pas 
aléatoire, il est toujours égal à l'unité (la première expérience est 
toujours indispensable). Chacun des autres termes peut aléatoire- 
ment prendre l’une des valeurs 0 ou 1. Etablissons le tableau de ré- 
partition de la variable aléatoire X, (i => 1), on a: 


(0 1 


P{i—1) |1—P(i—1) 


où P (i — 1) est la probabilité d’obtenir le résultat B après i — 1 
expériences. 

En effet, si le résultat B a déjà été obtenu lors des à — 1 expé- 
riences précédentes, on a X; —0 (l’i-ème expérience est superflue); 
si le résultat n’a pas été obtenu, on a X; = 1 (l’ i-ème expérience est 
indispensable). 

Nous allons trouver maintenant l’espérance mathématique de X:. 
Le tableau de répartition (10.3.21) donne: 


Me, =0-P(i—1)+1-[1—P(i—1)]=1—P(i—1). 


(10.3.21) 


Il est facile de voir que la même formule sera également vraie 
pour i — 1 car P (0) = 0. 

Nous allons appliquer à l'expression (10.3.20) le théorème d’addi- 
tion des espérances mathématiques. On a: 


m= D me,= Di (1—P(i—1)], 
Îe= D | 


ou, en introduisant la désignation i — 1 = x: 


Mmx= D) (1—P(k)]. (10.3.22) 


Rkm0 


En prenant le produit de la valeur obtenue de m, par le coût a 
de chaque expérience on trouve la somme moyenne à dépenser pour 
arriver au résultat B : 


S,=e Ÿ (1—P(B]. (10.3.23) 
hk=0 
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Cette formule a été trouvée en supposant que le coût de chaque 
expérience est le même. S'il n’en est pas ainsi, on peut utiliser une 
autre méthode, dans laquelle le coût total S , est la somme des coûts 
des différentes expériences pouvant prendre deux valeurs: a; si 
l'i-ème expérience est indispensable et zéro si elle est superflue. La 
dépense moyenne S, est: 

Sp = > af(i—P (k)]. (10.3.24) 
k=Û 

Problème 11. Espérance mathématique de 
la somme d'un nombre aléatoire de compo- 
santes aléatoires. 

Dans de nombreuses applications de la théorie des probabilités 
on rencontre des sommes aléatoires, dans lesquelles le nombre de 
composantes est inconnu d'avance, c’est-à-dire aléatoire. 

On se propose de résoudre le problème suivant. Soit une variable 
aléatoire Z somme de Ÿ variables aléatoires : 


Y 
z=> X4, (10.3.25) 


Y étant également une variable aléatoire. Supposons que l’on connais- 
se l'espérance mathématique m., de toutes les composantes : 


et que Ÿ ne dépende d'aucune des variables X:. 
Trouver l'espérance mathématique de Z. 
Solution. Le nombre de composantes de la somme est une 


variable aléatoire discrète. Supposons que l’on connaisse le tableau 
de répartition : 


umlil2l... 4]... 


Pal P:l Pal: +1 px |... 


où px est la probabilité pour que Ÿ prenne la valeur k. Soit Y — k, 
dans ce cas l'espérance mathématique de Z (espérance mathématique 
conditionnelle) est : 


R 
MEZIH= Dm. (10.3.26) 


Nous allons appliquer maintenant la formule de l'espérance mathé- 
matique marginale, à cet effet on multiplie chaque espérance mathé- 
matique conditionnelle par la probabilité de l'hypothèse correspon- 
dante p,, on a alors la somme: 


R 
MIZ]= Dpa D ms. (10.3.27) 
h ii 
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Le cas où toutes les variables aléatoires X;, X2, . . . ont même espé- 
rance mathématique 


Mrs = Ma = ce = My 


est particulièrement intéressant. 
La formule (10.3.26) devient alors: 


k 
MIZ|Kk]= D m—km, 
{m1 


et 
MIZ]=m, 2 kpP». (10.3.28) 


La somme dans l’expression (10.3.28) n’est rien d'autre que l’espé- 
rance mathématique de Y : 


My = 2 kPa, 


alors : 
m,—= MI(Zl=m,.m,, (10.3.29) 


c'est-à-dire que l’espérance mathématique de la somme d’un nombre 
aléatoire de composantes aléatoires de mêmes valeurs moyennes (si 
toutefois le nombre de composantes ne dépend pas de ces valeurs) 
est égale au produit des valeurs moyennes de chacune des composan- 
tes par le nombre moyen de composantes. 

Remarquons de nouveau que le résultat obtenu est vrai tant pour 
le cas des composantes X,, X2, . . . indépendantes que dépendantes, 
pourvu que le nombre de composantes Ÿ n'en dépende pas. 

Nous allons terminer le présent chapitre par l’examen d'un cer- 
tain nombre d'exemples puisés dans différents domaines, pour illus- 
trer comment utiliser les méthodes des caractéristiques numériques et 
les théorèmes démontrés plus haut pour les problèmes courants. 


Excmple 1. On jette 10 fois unc pièce de monnaie. Trouver l'espérance 
mathématique et l'écart quadratique moyen du nombre X de faces. 
Solution. Les formules (10.3.7) et (10.3.10) donnent: 


mx = 10-0,5 = 5; D, = 10-0,5-0,5 = 2,5; ©, = 1,58. 


Exemple 2. Cinq coups indépendants sont tirés sur une cible ronde 
de 20 cm de diamètre. On vise le centre de la cible, il n’y a pas d'erreur systéma- 
tique, la dispersion est circulaire. l'écart quadratique moyen © = 16 cm. Trou- 
ver l'espérance mathématique ct l'écart quadratique moyen du nombre de coups 
réussis. 

Solution. La probabilité d'atteindre la cible avec un coup peut être 
calculée par la formule (9.4.5): 


h2 
p=i—e ? —1—e0-0,62 + 0,455. 
On obtient à partir des formules (10.3.7) et (10.3.10) : 
m. = 9%p 2,32; D, =95p(i—p)=1,2%; 0, 1,12. 
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Exemple 3. Un garage dessert 40 automobiles et 70 camions. La pro- 
babilité pour que, durant un an, une automobile soit en réparation est égale 
à p1 = 0,6; la probabilité pour que, durant un an, un camion soit en réparation 
est égale à p2 — 0,3. Les voitures sont réparées indépendamment les unes des 
autres. Trouver l'espérance mathématique, la variance et l'écart quadratique 
moyen des grandeurs suivantes: 
du nombre X d'automobiles en réparation durant un an; 
du nombre Y de camions en ré tion durant un an; 
du nombre total Z — X + Y de voitures en réparation durant un an. 

Solution. D'après les formules (10.3.7) et (10.3.10) on a 


my, = 40-0,6 = 24; D, = 40-0,6-0,4 = 9,6; 0, = V 9,6 & 3,1; 
my = 700,3 = 21; D, — 70-0,3-0,7 = 14,7; 0, = V 14,7 = 3,8. 
En vertu du théorème d'addition des espérances mathématiques: 
M, = My + My = 24 + 21 = 45, 
et d.-théorème d’addition des variances: 
D, = D, + Dy = 9,6 + 14,7 = 24,3; 0, = V 24,3 & 4,9. 


Exemple 4.Les variables aléatoires X et Y sont les erreurs élémentai- 
res apparaissant à l’entrée d’un appareil. Leurs espérances mathématiques sont 
m, = —2 et my = 4, leurs variances D, — 4 et D,, — 9 et le coefficient de 
corrélation de ces erreurs r,y — —0,5. L erreur à la sortie de l'appareil est liée 
à l'erreur d'entrée par la relation fonctionnelle: 


Z = 3X2— 2XY + Y3 — 3. 


Trouver l'espérance mathématique de l'erreur à la sortie de l'appareil. 

Solution. 

Faisant usage de la relation existant entre les moments initiaux et centrés 
et de la formule (10.2.17) on a: 


MIX7]=a1[X]=D;t+mi=8; 
MIY9=e (Y]=Dy+m=s; 
M{XY]=memy+ Kzy = Mxmy+r:y0x0y = — 11, 


d'où m, = 3-8 — 2-(—11) + 25 — 3 = 68. 
Exemple 5. Une urne contient trois boules blanches et six noires. 
On en tire cinq boules dont X blanches. Trouver l'espérance mathématique et 


la variance de X. 
Solution. Chacun des cinq tirages de boules peut être considéré comme 


une expérience indépendante. La probabilité p de tirer une boule blanche est 
la D Le les expériences, elle est égale à 3/9 = 1/3. D où m, — 
HE Pour trouver la variance de X nous allons appliquer la formule (10.3.15). 
La probabilité P dans cette formule n'est rien d'autre que la probabilité de 
tirer deux boules blanches lors de deux tirages: 


P —3/9-2/8 — 1/12. 
La formule (10.3.15) donne: 
D:=5.1/3-.2/3+5-4.(1/12—(1/3)2) = 5/9. 


Exemple 6. Un radiotélescope durant un temps ! scrute l'espace où 
se trouve un groupe de quatre objectifs. Durant ce laps de temps chacun des 
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objectifs peut être détecté. La probabilité de détection du premier objectif est 
Ps = 0,2, du second p: = 0,25, du troisième p,; — 0,35, du quatrième p, = 0,42. 
Trouver l'espérance mathématique et l'écart quadratique moyen du nombre 
d'objectifs qui seront détectés durant le tem 


ps t. 
Solution. Soit X le nombre d'objectifs détectés. En appliquant la 
formule (10.3.6) on obtient: 


& 
mx= Ÿ pi=0,2+0,25+0,35+ 0,42 — 1,22. 
1=1 
La formule (10.3.8) donne: 


& 
De= Ÿ pig=0,2-0,8+ 0,25-0,75+ 0,35.0,65+0,42-0,58—0,818 : 
EE 2 | 


0, = V 0,818 + 0,904. 


Exemple 7. On envisage de réaliser un certain nombre de mesures, 
donnant chacune en cas de succès un bénéfice net égal à X, réparti suivant une 
loi normale de valeur moyenne m — 2 (en unités conventionnelles); le nombre 
de mesures durant la période considérée est aléatoire et réparti suivant la loi: 


pl1121314 

pt 10,210,310,410,1 
de plus, ce nombre ne dépend pas du bénéfice offert par les mesures. Trouver 
le bénéfice moyen éventuel pour toute la période en question. 


Solution. En se basant sur le problème 11 du présent paragraphe on 
trouve l'espérance mathématique de bénéfice total Z: 


Mz = My Mys 


où m, est le bénéfice moyen d'une mesure, m,, le nombre moyen de mesures 
éventuelles. 


On a: 
my = 1-0,2 + 2:0,3 + 3-0,4 + 4-0,1 — 2,4; 
my = 2; 
m, = 2-2,4 = 4,8. 
Exemple 8. L'erreur d’un appareil est donnée par la fonction: 


U—3Z+2X —Y—4, (10.3.30) 


où X, Y, Z sont les erreurs élémentaires, formant un système de variables aléa- 
toires (vecteur aléatoire). 
Le vecteur aléatoire (X, Y, Z) est caractérisé par les espérances mathéma- 
tiques: 

m, = —4; m,=1; m =1 


et la matrice des variances-covariances: 


D> Key K>z 2 1 — 1 
Dy Kyzl=l 3 1l,. 
D; à 


Trouver l'espérance mathématique, la variance ct l’écart quadratique 
moyen de l'erreur de l'appareil. 
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Solution. La fonction (10.3.30) étant linéaire, on a en vertu des for- 
mules (10.2.6) et (10.2.13): 


Mu =Im; + 2m; —mMy—4—= — 410; 
Du=B.D,+ 22. De 42 Dy 213.2 Kes +3 (—1) Kyz + 2(—1) Kayl= 25 ; 
Ou = 9. 


Exemple 9. Pour localiser le défaut d'un ordinateur on effectue des 
tests. Par chacun des tests le défaut est localisé indépendamment des autres 
avec une probabilité p — 0,2. Un test dure environ trois minutes. Trouver 
l'espérance mathématique du temps nécessaire à la localisation du défaut. 

Solution. En utilisant le résultat du problème 9 du présent paragraphe 
(RARE mathématique du nombre d'expériences avant la k-ième réalisation 

e l'événement À), posant k = 1, on trouve le nombre moyen de tests: 
1 1 


Mr=—=—<=S. 


p 0,2 
La durée moyenne de ces tests est : 
5-3 — 15 (minutes). 


Exemple 10. Des coups sont tirés sur un réservoir d'essence. Chaque 
coup a une probabilité d'atteinte égale à 0,3. Les coups sont indépendants. 
Le premier coup atteignant le réservoir donne lieu seulement à une fuite, à la 
suite du second coup l'essence s'enflamme, après quoi le tir est arrêté. Trouver 
l'espérance mathématique du nombre de coups tirés. 

Solution. En utilisant la même formule que précédemment on peut 
trouver l'espérance mathématique du nombre de coups précédant la seconde 
atteinte: 


2 
mx gg 0,67. 
Exemple 11. La probabilité de détecter un objectif à l’aide d’un radar 
croît avec le nombre de cycles d'exploration suivant la loi: 


P (n) = 1 — 0,87, 


où n cest le nombre de cycles à partir du début de l'observation. 

Trouver l'espérance mathématique du nombre de cycles précédant la détec- 
tion. 

Solution. En utilisant les résultats du problème {0 du présent para- 
graphe on a: 


mx= D (1—P(H}= D 0,8n— 53 5, 


Rk=0 Ra 


Exemple 12. Pour recueillir une certaine information sur les condi- 
tions à la surface d'une planète peu explorée, des stations d'observation sont 
lancées dans la région en question. Chaque station atteint la région avec, une 
probabilité égale à 0,7. Pour recueillir l'information nécessaire 1l suffit trois 
stations. Une seule station ne peut pas s'acquitter de la tâche, deux stations 
le feront avec une probabilité égale à 0,4. La liaison avec la région est perma- 
nente; les stations supplémentaires ne sont lancées que si la tâche n'est pas 
accomplie. Trouver l'espérance mathématique du nombre de stations à lancer. 

Solution. Soit X le nombre de stations parvenues dans la région d'étu- 
de et suffisantes pour recueillir l'information nécessaire. Dans le problème 
10 du présent paragraphe nous avons trouvé l'espérance mathématique du nombre 
d'espériences nécessaires pour obtenir un certain résultat dont la probabilité 
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croît avec le nombre d'expériences suivant la loi P (n). Cette espérance mathé- 
matique est égale à: 


mx= ÿ, [1—P(k)]. 
R=0 


Dans le cas présent: 
P(0)=0; P(1)=0; P(2=0,4; P(3) = 1; 
P(4)=P4{5)=...1. 
L'espérance mathématique de la variable aléatoire X est égale à: 


mx =M(X]= D [1— P (k)]=1+1+0,6—2,6. 
Rk=0 


Ainsi pour rassurer l’accomplissement de la tâche il faut que dans la région en 
question arrivent en moyenne 2,6 stations. 

Proposons-nous de résoudre maintenant le problème suivant. Combien 
de stations faut-il envoyer en moyenne dans une région donnée pour que 2,6 sta- 
tions arrivent à destination? Nous allons raisonner comme suit. Supposons qu'on 
envoie Ÿ stations. Le nombre de stations arrivant dans la région en question 
peut s’écrire comme la somme: 


X=LZ +Z+...+2,, 


où Z = 1 si l'i-ème station arrive à destination et Z — 0 dans le cas contraire. 
La grandeur X n'est rien d'autre que la somme d'un nombre aléatoire de compo- 
santes aléatoires (voir problème 11 du présent paragraphe). On a ainsi 


MIX] _ 2,6 
MIZi) MIZi° 


Mais M [Z:] = p où p est la probabilité d'arrivée dans la région en question 
d’une station lancée (dans notre cas p = 0,7). On a: 


d'où : 
M[Y]= 


2,6 
my —=M M5; = 3,71. 

Ainsi pour recueillir l’information dans une région donnée d’une planète 

il faut y envoyer en moyenne 3,7 stations. 
Exemple 13. Une station radar explore une région où se trouvent 
N objectifs. robabilité de détecter chacun des objectifs est égale à ê (indé- 
pense de la détection des autres objectifs). Chaque cycle dure +. Combien 
e temps faut-il pour détecter en moyenne k objectifs d'un ensemble de N. 
Solution. Nous allons tout d’abord trouver l'espérance mathématique 
du nombre des objectifs détectés à la suite de nr cycles d'exploration. Après 
n cycles un quelconque des objectifs est détecté avec une probabilité égale à: 


Pn=1—(1—p)"; 


en vertu du théorème d'addition des espérances mathématiques, le nombre moyen 
d'objectifs détectés dans nr cycles est (voir problème 5 du présent paragraphe) : 


MIX) = NU — (1 — pr]. 
NUH—(—prl= Re, 
on trouve l'équation donnant le nombre nécessaire de cycles: 


Posant 


k 
1—(—p" =. 
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La solution de cette équation est: 


ve(s-À) 
FT og A —p) 


d'où le temps nécessaire pour détecter en moyenne k objectifs: 


lg (1-7) 


= ET ——— 


log (1—p) 

Exemple 14. Modifions les conditions de l'exemple 13. Supposons 

qe la station radar ee la région seulement jusqu'à ce que k objectifs soient 

étectés, après quoi l'exploration est interrompue ou poursuivie dans une 
ue région. Trouver l'espérance mathématique du temps nécessaire à cette 
opération. 

Pour résoudre ce problème il ne suffit y x 
lus de connaître la probabilité de détection 
‘un objectif dans un cycle, il faut encore 

indiquer la manière dont augmente, avec le 
nombre de cycles, la probabilité pour que 
d'un groupe de N objectifs au moins k soient 
détectés. Pour calculer cette probabilité le 
plus simple est de supposer que les objectifs 
sont détectés indépendamment les uns des 
autres. Nous allons résoudre ce problème 
dans cette hypothèse. 

Solution. Lorsque les détections 
sont indépendantes, détecter n objectifs 
équivaut à réaliser n expériences indépen- 
dantes. Après n cycles chacun des objectifs 
est détecté avec une probabilité égale à: 


Pn=1—(1—p}r. 


Le théorème des expériences répétées permet de trouver la probabilité pour que 
dans n cycles, k au moins d'un groupe de N objectifs soient détectés: 


À}, 
Fig. 10.3.2 


X? Às 


N 
REn= D, CRPR (1— PR). 
Mah 


Le nombre moyen de cycles après lesquels k objectifs au moins seront 
détectés est donné par la formule (10.3.22) : 


œ N N 
= D Re D [1— D CnPr (APN). 
fim0 ve 0 Man K 


. Exemple 15. Le point aléatoire M du plan z0y de coordonnées (X, Y) 
s'écarte de la position requise (origine des coordonnées) sous l'influence de trois 


erreurs vectorielles CA Va et LA Chacun des vecteurs (fig. 10.3.2) est caracté- 
risé par deux composantes, soient : 


F, (Xu Yi: Va (X2, Ÿ2); LA (X ss). 
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Les caractéristiques numériques de ces vecteurs sont : 


me, = 2 nmy= —43, Cry — 2 
Ma = —À, m = —2, Ora = 4 
M à: My = 1, rs = 2, 

On = Troy = — 09 

Oye = 1 l'ravs — 019 ; 

Oya = 2 lxays = 02e 


Trouver les caractéristiques de l'erreur totale (vecteur de l'écart du point M 
de l’origine des coordonnées). 

Solution. En vertu du théorème d’addition des espérances mathéma- 
tiques, des variances et des covariances on a: 


Me = Mes Ÿ Mrs Mrs 4 

= y ya M —$ 
où=03,+0% +0! —24, 0: V24% 4,90, 
00 +03, +ot,—14, oy=V14 3.75, 

Kzy =K ;iys + Exava + Kxsvs: 


où 
Key = xx ya = —0,3-2-3— —1,8, 
K sus = TrxsusTx3Vy3 — 0,2-2-2=—0,8, 
d'où 
K y = — 1,8+2,0+0,8— 1,0 
et 


E 1,0 
*ÿ7 4,90-3,75 


Exemple 16. Un corps ayant la forme d'un parallélépipède rectangle 
de cotes a, b. c vole dans l'espace en tournant autour de son centre de masse 
de telle sorte que toutes ces orientations sont phone Le corps se meut 
dans un flux de particules et le nombre moyen de particules le rencontrant est 
PAPER OnSeS à l'aire moyenne de la surface se présentant au flux. Trouver 

‘espérance mathématique de l'aire de la projection du corps sur un plan perpen- 
diculaire à la direction du mouvement. 

Solution. Toutes les orientations du corps dans l’espace étant équi- 
probables, la direction du plan de projection peut être quelconque. Il est évi- 
dent que l’aire de la projection du corps est égale à la moitié de la somme des 
projections de toutes les faces du parallélépipède (car chaque point de la projec- 
tion est la projection de deux points de la surface du corps). En vertu du théorè- 
me d’addition des espérances mathématiques et de la formule de l’aire moyenne 
de la projection d'une figure plane (voir exemple 3 du 8 10.1) on a: 


ab , ac , be  S 
LE RE RE air 


= 0,054. 


où S est l'aire totale de la surface du parallélépipède 
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Notons que la formule obtenue est vraie non seulement pour un parallé- 
lépipède mais également pour tout corps convexe: l’aire moyenne de la projec- 
tion d’un tel corps pour une rotation désordonnée est égale au quart de son aire 
totale. Nous recommandons au lecteur de démontrer cette assertion à titre 
d'exercice. 

Exemple 17. Un point x se meut d’une manière aléatoire le long de 
l'axe des abscisses Oz. Au moment initial il se trouve à l’origine des coordonnées 
et commence à se mouvoir à droite avec une probabilité égale à 1/2 et à gauche 
avec une probabilité 1/2. Après avoir parcouru un segment unitaire le point 
continue son mouvement dans la même direction avec une probabilité égale 
à p ou change de sens avec une probabilité q = 1 — p. Après avoir parcouru 
un segment unitaire il peut de nouveau continuer son mouvement dans la même 
direction avec la probabilité p ou changer de sens avec la probabilité 1 — p, 


Par suite de ce mouvement errant suivant l'axe des abscisses, après nr pas 
le point x se trouvera à une distance aléatoire X, de l’origine. Trouver l’espéran- 
ce mathématique et la variance de X,. 

Solution. Par suite de la symétrie du problème. on a M[X,] = 0. 
Pour trouver D [X,,] nous allons écrire X,, comme une somme de nr termes: 


Xn=Ui+Uit...+Un= ŸS Ur, (10.3.31) 


ii 
où U, est la distance parcourue par le point pendant l'i-ème pas. c'est-à-dire + 1 
si le point se déplaçait vers la droite et — 1 s'il se déplaçait vers la gauche. 
En vertu du théorème sur la variance d’une somme {voir formule (10.2.10)] 
on a: 


n 
D{Xh]= Ÿ D{Ui]+2 Ÿ Kuuy 
== i<j 


I1 est évident que D [U,] = 1, car la variable U, prend les valeurs +1 et —1 
(en vertu des mêmes conditions de symétrie). Les covariances’ sont: 


Eau, = M (10 =M [Ua 5]. 

On commence par le cas où j = i + 1 quand les variables U; et U; sont 
voisines dans la somme (10.3.31). Il est évident que UV, Di prone la valeur +1 
avec la probabilité p et la valeur —1 avec la probabilité g. On a: 

Ko, g = MUTiUil=tP+(— 1-9 =p— 9. 

Considérons ensuite le cas j — { + 2. Dans ce cas le produit U,U; est égal 
à +1, si l’£-ème et l'i + 2-ème pas étaient diri dans le même sens. Ceci 
peut avoir lieu de deux manières différentes. Ou bien le point z fait tous les 
trois pas: l'i-ème. l'i + 1-ième et l’t + 2-ième dans la même direction, ou 
bien cette direction a changé deux fois durant ces trois pas. La probabilité pour 
que U,U +2 = 4 est égale à : 


P (UV 142 = 1) = P ((UiU i4s = 1) (V4 142 =1)) + 
+ P ((UiU 141 = — 1) (UisaU 142 = — 1)) = p? + q2. 


Nous allons maintenant trouver la probabilité pour que U;U,42 — —1. 
Ceci peut également avoir lieu de deux manières différentes, le point peut chan- 
ger de direction en passant du i-êème au & + 1-ième pas et conserver cette direc- 


240 CARACTÉRISTIQUES DES FONCTIONS DE VARIABLES [CH. 10 


tion en passant du { + 1-ième au { + 2-ième pas, ou inversement. On a donc: 
P (Ua 142 —1)= P (UV 141 = —1) (UisaU ia 1) + 
+ P (UV 141 = 1) (UissU142= —1)) = 2pq. 


Ainsi la variable U,U,.,2: prend deux valeurs possibles: +1 et —1, avec 
les PROS respectives p? + q? et 2pq. Son espérance mathématique est 
6e à: 


Æuju,,, = MU i2]=p° +92 —2pq=(p— 0)°. 


On peut facilement montrer par récurrence que pour un nombre quelcon- 
que k séparant les pas considérés dans la suite U,, U>, ..., Un on a les for- 


mules : 
P (UiU in = 1) =p" + Ciph-292 + Céph-tgt + ….., 
P (UiUisn = —1)=Cipt-1g+ Ciph-3g + ..…., 
par conséquent : 
= (p—g)à. 


EUR 
dr la matrice de corrélation du système de variables aléatoires U;,. U2, ... 
... Un Sera: 

1 p—q (p—g)? ...(p— ag)" 
1 p—g ...(p—g}r2 

I Kuu,l= 1  _...(p— gs 

1 
La variance de la variable aléatoire X, sera: 


DIXnl= D DIUI+25 Kuu,æn+2 D (p—9)yis 
{m1 i<j i<j 


ou en prenant la somme des éléments se trouvant à une même distance de la 
diagonale principale: 
n—1 


D{Xn]l=n+2 Ÿ (n—k)(p—g}. 
Ru 1 


Exemple 18. Trouver l'asymétrie de la loi binomiale 
P(X=m)=Cmpman-m (g—1—p). (40.3.32) 


Solution. On sait que la loi binomiale (10.3.32) est la répartition 
du nombre d'apparitions dans n expériences indépendantes d'un certain évé- 
nement qui a la probabilité p de se réaliser dans chacune des expériences. On 
écrit la variable aléatoire X, nombre d'a Part ions de l'événement dans n 

Variab es 


experiences. comme la somme de n aléatoires. 
n 
X = » X4. 
{mi 
où 
__f 1 si dans l'i-ème expérience l'événement est apparu: 
E— { 0 si dans l'{-ème expérience l'événement d'est nes apparu. 


10.3) APPLICATIONS DES THÉORÊMES 241 
En vertu du théorème d'’addition des moments centrés trois on a: 
nn 
Us [(X]= 2 us [Xi]. (10.3.33) 


Nous allons calculer le moment centré trois de X;. Sa loi de répartition est 
donnée par le tableau : 


CHE 
qgipP 
Le moment on trois de X, est égal à (0 — p}° q + (1 — g)p = 


— p3 


+ g (g — p). 
La substitution dues (0. 3. 33) donne: 
Us[X]= D pa(g—p)=npq(q—p). 
{mi 


Pour trouver l’asymétrie il faut diviser le moment centré trois de X par 
le cube de l'écart quadratique moyen: 


Sk— npq(g—p) _ Q—P. 
(npq)?  V/npq 


Exemple 19. Soient n variables aléatoires positives de même loi de 
répartition: 
Kiss Koss sr Aus 


Trouver l'espérance mathématique de la variable aléatoire 


Z a 
1 Xi+Xo+.. +AÂn 


Solution. Ilest clair que l'espérance mathématique de la variable Z, 
existe car elle se trouve entre zéro et l'unité. Il est de ne facile de voir que la 
loi de répartition du système (X1. X2. .... Xhn). quelle qu'elle soit. est symé- 
trique par rapport à ces variables. c ‘est-à-dire reste inchangée lors d’une permu- 
tation quelconque. Considérons les variables aléatoires 


 — 
Xi Xate+Xn 7 XitXit... +Xn! 
., Z Xn 


A TS veus 


Il est évident que leur loi de répartition doit également être symétrique, c'est- 
à-dire qu’elle ne doit pas changer lorsque l’on remplace un argument par un 
autre. Par conséquent : 


M [2:11 = M [22] = = M {Z,]. 


De plus. on sait que la somme des variables aléatoires Z:, Z2. .. 
est égale à l'unité, par conséquent, en vertu du théorème d’ addition des re 
rances mathématiques on a: 


d'oi MIZ)+MIZ]l+...+MIZ)=M(]=1 
où 

M{(Z:]=M[2]=...—M Zn1= À - 
16—2823 


CHAPITRE 11 


LINÉARISATION DES FONCTIONS 


11.1. Méthode de linéarisation des fonctions 
d'arguments aléatoires 


Dans le chapitre précédent nous avons étudié un appareil mathé- 
matique très commode de la théorie des probabilités, à savoir l'appa- 
reil des caractéristiques numériques. Dans de nombreux cas il per- 
met de trouver les caractéristiques numériques des grandeurs aléa- 
toires (et en premier lieu l’espérance mathématique et la variance) 
d’après les caractéristiques numériques des arguments, laissant de 
côté les lois de répartition. Ces méthodes de détermination directe 
des caractéristiques numériques sont applicables essentiellement aux 
fonctions linéaires. 

Dans la pratique on rencontre souvent des cas où la fonction étu- 
diée des variables aléatoires bien que non strictement linéaire, diffère 
peu d’une fonction linéaire et peut dans certains problèmes être 
remplacée par une fonction linéaire. Ceci provient de ce que, dans la 
majorité des applications pratiques, les variations aléatoires des gran- 
deurs figurant dans ces fonctions apparaissent comme des erreurs 
insignifiantes, se superposant à la loi de base. Ces erreurs étant rela- 
tivement peu importantes, les fonctions que l’on rencontre dans les 
problèmes, bien que non linéaires dans tout le domaine de variation 
des arguments, se trouvent être presque linéaires dans un domaine 
étroit de leurs variations aléatoires. 

En effet, on sait que toute fonction continue dérivable, dans un 
domaine assez restreint de variation des arguments peut approxima- 
tivement être remplacée par une fonction linéaire (on dit que cette 
fonction est linéarisée). L'erreur apparaissant alors est d'autant plus 
petite que sont étroites les limites de variation des arguments et que 
la fonction est voisine de la loi linéaire. Si le domaine des valeurs 
que peuvent prendre les arguments aléatoires est suffisamment petit 
pour que dans ce domaine la fonction puisse avec une précision suffi- 
sante pour les applications pratiques, être linéarisée, on peut appli- 
quer à cette dernière l’appareil des caractéristiques numériques éla- 
boré pour les fonctions linéaires. Connaissant les caractéristiques 
numériques des arguments on peut alors trouver les caractéristiques 
numériques des fonctions. Evidemment, on aura alors une solution 
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approchée du problème, mais dans la majorité des cas, on n’a pas be- 
soin de la solution exacte. 

Dans les applications pratiques où les facteurs aléatoires donnent 
lieu à des perturbations insignifiantes se superposant aux lois de base, 
la linéarisation est presque toujours possible. 

Considérons, par exemple, le problème de balistique extérieure 
concernant le mouvement du centre de masse d'un obus. La distance 
X de vol d’un obus se détermine comme une certaine fonction des 
conditions de tir, à savoir de l’angle de jetée 6,, de la vitesse initiale 
v, et du coefficient balistique c: 


X — ® (60, Vo, €). (11.1.1) 


La fonction (11.1.1) est non linéaire dans tout le domaine de varia- 
tion des arguments. C’est pourquoi dans le problème de base de balis- 
tique extérieure la fonction (11.1.1) est non lineaire et ne peut pas 
être linéarisée. Néanmoins, il y a des cas où ces fonctions peuvent 
être linéarisées; ce sont les problèmes lies à l'étude des erreurs. 
Supposons qu'il y ait lieu de trouver l'erreur aléatoire de la distance 
de vol X d’un obus, liée à la présence d'un certain nombre de facteurs 
aléatoires : l’imprécision sur l'angle 6,, les oscillations du tube lors 
du coup, la non-homogénéité balistique des obus, les poids diffé- 
rents des charges, etc. Nous pouvons alors fixer certaines conditions 
nominales du tir et considérer les écarts accidentels à ces conditions. 
La gamme de ces variations aléatoires est, en général, restreinte et 
la fonction y, bien que non linéaire dans tout le domaine de ses argu- 
ments, peut être linéarisée dans un domaine étroit de leurs varia- 
tions aléatoires. 

La méthode de linéarisation des fonctions des arguments aléa- 
toires est couramment appliquée dans de nombreux domaines tech- 
niques. Très souvent, après avoir obtenu la solution d’un problème 
par les méthodes ordinaires des sciences exactes, on désire estimer 
les erreurs possibles de cette solution dues à l'influence de facteurs 
aléatoires dont on n’a pas tenu compte. Dans ce cas le problème peut 
être résolu par linéarisation, car les variations aléatoires figurant 
dans le problème ne sont, en général, pas très importantes. S'il n’en 
était pas ainsi et si les variations aléatoires des arguments se trou- 
vaient au-delà du domaine de linéarisation approchée des fonctions, 
la réalisation technique envisagée ne serait pas satisfaisante car son 
indétermination serait trop grande. 


11.2. Linéarisation d'une fonction 
d'un argument aléatoire 


Dans la pratique il est rare qu’il y ait lieu de linéariser une fonc- 
tion d'un seul argument aléatoire, en général, on est obligé de tenir 
compte de l'influence d'un ensemble de facteurs aléatoires. Cepen- 


16" 
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dant, du point de vue méthodique, il est commode de commencer par 
ce cas le plus simple. Soit la variable aléatoire X dont on connaît 
les caractéristiques numériques : l’espérance mathématique m. et la 
variance D... 

Supposons que les valeurs possibles de X se situent entre « et B, 


c'est-à-dire : 
P(a< X<B)= 1. 


Soit maintenant une autre variable aléatoire Y, [liée à X 
par la relation fonctionnelle 


Y = p(X) *), (11.2.1) 


y=p(x) la fonction , bien que non linéaire, 
diffère peu d’une loi linéaire sur le 
segment (œ, B). 

Il y a lieu de trouver les caracté- 
ristiques numériques de Ÿ, à savoir 
son espérance mathématique m, et sa 
variance D. 

Considérons la courbe y — œ (x) 
dans l'intervalle (œ, B) (fig. 11.2.1) 
et remplaçons-la par la tangente au 
point M d’abscisse m.. Cette tangente 
a pour équation: 
y=p(n,)+p (m) (z—m;). (11.2.2) 


Supposons que l'intervalle des valeurs possibles de l'argument 
{&, B) soit suffisamment étroit pour que la courbe et la tangente diffè- 
rent peu. On peut alors remplacer la courbe pratiquement par un 
segment de tangente ; dans l'intervalle (œ, B) la fonction y — @ (x) 
se trouve être presque linéaire. Les variables aléatoires À et Y sont 
approximativement liées par la relation linéaire: 


Y=@p(m.) + p'(m) (X—m), 
ou, en introduisant la désignation À — m, — X: 
Y=op(mx) +p (m) X. (11.2.3) 


On peut jappliquer à [la fonction linéaire (11.2.3) les méthodes 
connues de recherche des caractéristiques numériques des fonctions 
linéaires (voir $ 10.2). Pour trouver l'espérance mathématique de 
cette fonction linéaire il y a lieu de substituer dans son expression 
(11.2.3) l'espérance mathématique de À égale à zéro. On obtient: 


My = P (M). (11.2.4) 


*) On suppose que sur le segment (x, f) la fonction æ est continue et déri- 
vable. 


Fig. 11.2.1 
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La variance de Y est donnée par la formule: 


Dy=1p'(m;)l Ds. (11.2.5) 
En passant à l'écart quadratique moyen, on a: 
Oy= | P(mx) | Ox- (11.2.6) 


Les formules (11.2.4), (11.2.5), (11.2.6) sont évidemment appro- 
chées car le fait de remplacer une fonction non linéaire par une fonc- 
tion linéaire est déja une approximation. 

Nous avons ainsi résolu le problème posé et nous sommes arrivés 
aux conclusions suivantes. 

Pour trouver l’espérance mathématique d’une fonction presque 
linéaire il faut remplacer, dans l’expressian de la fonction, l’argu- 
ment par son espérance mathématique. Pour trouver la variance d’une 
fonction presque linéaire il faut multiplier la variance de l'argument 
par le carré de la dérivée au point correspondant à l’espérance mathé- 
matique donnée de l’argument. 


11.3. Linéarisation d’une fonction 
de plusieurs arguments aléatoires 


Soit un système de x variables aléatoires : 
(A1, X2 . Xn) 


et soient données les caractéristiques numériques du système, à 
savoir les espérances mathématiques : 


Mis Maxgs + Main 


et la matrice de corrélation : 


K\, K ee Kin 
Ko ... Kon 
I Ki, = - e . e bi 
Khan 
La variable aléatoire Ÿ est une fonction des arguments X,, 
X), RE D, 
Y == P (Xi, X), . À n). (11.3.1) 


La fonction p n’est pas linéaire, mais diffère peu d'une fonction linéai- 
re dans le domaine des valeurs possibles de tous les arguments, c’est- 
à-dire, c'est une fonction presque linéaire. Il y a lieu de trouver les 
caractéristiques numériques de Ÿ , donc l'espérance mathématique m, 
et la variance D. 


Pour résoudre ce problème il y a lieu de linéariser la fonction : 
= @ (Zi, Le, :.., 2). (11.3.2) 
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On ne peut pas donner ici l’interprétation géométrique car au- 
delà de l’espace tridimensionnel elle n’est plus figurative. Cependant 
qualitativement tout est analogue au cas étudié au paragraphe pré- 
cédent. 

Considérons la fonction y = (x, Zz2, ..., Th) au voisinage 
immédiat du point My, Myss + . M, - La fonction au voisinage 
de ce point étant presque linéaire, elle peut être approximativement 
remplacée par une fonction linéaire. Ceci équivaut à ne conserver dans 
son développement en série de Taylor au voisinage du point (m..,, 
Mxys + --, M,.) que les termes du premier ordre et à négliger les 
autres termes : 


Y= PT, Los ..., Zn) À D (Mass Mass ee es Mxn) + 


n 
+ à Pr, (Mes, Mzxgs =.) Mxn) (x: — Mx,). 
= 


Ceci signifie que la relation (11.3.1) entre les variables aléatoires 
peut être remplacée par une relation linéaire : 


= Ur (Ms, Mxgs Mxn) + à P, (Mxs Mzxas -..) Mxn) (Xi—mz,). 


(11.3.3) 
Pour simplifier introduisons les désignations: 
Pr (Mess Mxg + +1 Mxn) = +) 


Comme X; — Mzx, = X: la formule de 3.3) s'écrit comme suit : 


V= Dm Men ce me) + À (À Xi. (113.4) 


i=1 

On peut appliquer à la fonction linéaire (11.3.4) les méthodes de 
calcul des caractéristiques numériques des fonctions linéaires établies 
au $ 10.2. Les arguments centrés (X1, X2, . .., X,) ayant des espé- 


rances mathématiques nulles et la même matrice de corrélation || K:||, 
on a: 


OZ; 


My = D (Mxis Mass +; Mxn)) (11.3.5) 
=> En Da +22 (a) (E). Ky. (11.3.6) 


En passant a la dernière a des variances aux écarts qua- 
dratiques ie Li on obtient: 


o? > (5% nat 22 (2). (5), 0x ,0xp  (11.3.7) 


où ri, est le sliiel de on des grandeurs X:, À. 
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La formule (11.3.7) est particulièrement simple lorsque les varia- 
bles X,, X2, ..., X, ne sont pas corrélées, c’est-à-dire lorsque 
ry = 0 pour i- )j. Dans ce cas: 


=» (5) 04, (11.3.8) 
i= 1 


OZ; 


Les formules (11.3.7) et (11.3.8) ont de nombreuses applications 
pratiques, par exemple, l'étude des erreurs des différents appareils 
et mécanismes ou la précision des tirs et des bombardements. 


11.4. Précision des résultats obtenus 
par la méthode de linéarisation 


Dans certains problèmes pratiques la gamme des variations pos- 
sibles des arguments aléatoires n’est pas suffisamment petite pour 
que, dans ses limites, la fonction puisse être linéarisée avec une pré- 
cision suffisante. 

Il est conseillé dans ce cas, pour juger de l’applicabilité de la 
méthode de linéarisation et pour préciser les résultats obtenus, d'uti- 
liser la méthode suivant laquelle on conserve dans le développement 
de la fonction, outre les termes linéaires, plusieurs termes d'ordre 
supérieur, en estimant toujours l’erreur due à ces termes. 

Pour préciser cette méthode nous allons considérer tout d’abord 
le cas simple d’un seul argument. La variable aléatoire Ÿ est une 
fonction de l’argument aléatoire X : 


| Y = p(X), (11.4.1) 


la fonction y, étant presque linéaire dans le domaine des valeurs pos- 
sibles de l’argument X, présente des écarts suffisamment grands pour 
que l’on puisse mettre en doute l’applicabilité de la méthode de linéa- 
risation. Pour le vérifier nous allons appliquer une méthode plus pré- 
cise, à savoir le développement de œ en série de Taylor au voisinage 
du point m,, en ne conservant dans le développement que les trois 
premiers termes : 


y — ® (x) + (mx) ni p'(mx) (r— ms) SE _ p'(mx) (z — m;)*. (11.4.2) 


Les variables aléatoires Y et X sont évidemment liées par la même 
relation : 


Y= pins) +p(mx) (X— mx) +5 p" (mx) (X— ma) = 
=p(m;)+p" (M) À ++ p(mx) X2. (11.4.3) 


En utilisant l'expression (11.4.3) on peut trouver l'espérance 
mathématique et la variance de Ÿ . En appliquant les théorèmes sur 
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les caractéristiques numériques on a: 
my=p(ms) ++ p(ms) MIX*1=p(ms)++9"(m) De. (11.44) 


La formule (11.4.4) donne la valeur précisée de l'espérance mathé- 
matique qu'on peut comparer à la valeur de y (m.) obtenue par linéa- 
risation ; la correction tenant compte de la non-linéarité de la fonc- 
tion est donnée par le second terme de la formule (11.4.4). 

Le calcul de la variance des premier et second membres de la 
formule (11.4.3) donne: 


Dy=lg" (ma) De ++ [op (m)l D [A3] + 
+ p' (ms) pm.) K IX, X2], (11.4.5) 


où KIX : X2] est la covariance des valeurs X, x. 
Exprimons les grandeurs entrant dans la formule (11.4.5) en fonc- 
tion des moments centrés de X: 


DIX] = M (XJ— {M (X2]} = pe [X]— DE, 
KIX, X]=M (X{X2— M [X2]}] = ps [X]. 


Finalement on obtient: 
D,= 1" (ms) D ++ 1" (m2)? (ua [X]— DE) + 


+ p' (m2) p" (mx) ds (XI. (11.4.6) 


La formule (11.4.6) donne une valeur plus précise de la variance 
que la méthode de linéarisation ; les second et troisième termes don- 
nent la correction due à la non-linéarité de la fonction. En plus de 
la variance D, de l’argument la formule contient également les mo- 
ments centrés trois et quatre 3 [X], 4 (X]. Lorsque l'on connaît 
ces moments la correction à la variance est donnée directement par 
la formule (11.4.6). Cependant, souvent il n’est pas nécessaire de la 
déterminer, il suffit d'en connaître l’ordre de grandeur. Dans la pra- 
tique on rencontre souvent des variables aléatoires obéissant à la 
loi normale. Pour une variable aléatoire normale on a: 


Hs[X]=0; pe [X]= 307 = 3D; (11.4.7) 
et la formule (11.4.6) devient alors : 
Dy= 1" (m3)}° De++ [9 (m;)]? DZ. (11.4.8) 


On peut utiliser la formule (11.4.8) pour estimer approximative- 
ment l'erreur de linéarisation lorsque l'argument est réparti suivant 
une loi voisine de la loi normale. 
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On peut appliquer une méthode analogue à une fonction de plu- 
sieurs arguments 7 


— ® (X1, X2, ._. Xh). (11.4.9) 
En développant : fonction 
y = P(%s T2 «.., Tn) 


en série de Taylor au voisinage du point m,,, Mu , ..., mx. et 


en ne conservant que les termes d'ordre non supérieur à deux, on 
obtient l’approximation suivante: 


P= pm Mans 2er Man) + D (SE), Aime) + 
i=1 


52 (Se ôx} ee). (Xi— mx)" + 2 2 ET =). (Xi — Mr.) (X;— mx) 
ou, en PP les us mentionnées icentrées : 


Y =o(m.., Meg» Mxn) + D (5) + 
i=i - 


+ 12 (= 0x? =) X! + à En Oz 0x ),, XX (54729) 
1 


où l'indice m Frs comme précédemment que dans la dérivée 
partielle les arguments X,; ont été remplacés par leurs espérances 
mathématiques m... 

En appliquant à la formule (11.4.10) l'opération d'espérance 
mathématique on a: 


de 
My = P (Mxss Maxss ee Msn) + > CR, 


+3 (—). Ka (11.4.11) 
1<7J 


où X,, est la covariance des valeurs X;, À. 
Dans le cas le plus important pour les applications pratiques lors- 
ue les arguments X:, X2, ..., X, ne sont pas corrélés, la formule 
(11.4.11) devient : 


1 =: 92 
My = ® (Ms Mzxs) ..e) Mxn) +5 > (Sr), Der (11.4.12) 
i=1 


Le second terme dans la formule (11.4.12) donne la correction due 
à la non-linéarité de la fonction. 
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Passons au calcul de la variable Y. Pour trouver son expression 
sous la forme la plus simple, supposons que les variables X,, X>, .. 
.., À, soient non seulement non corrélées mais également indé- 
pendantes. En calculant la variance des premier et second membres 
de (11.4.10) et en utilisant le théorème de la variance d’un produit 
(voir $ 10.2) on a: 


n 


D, 5 (Een +4 5 (S)É utI—Dt)+ 
ii 1 


+3 (nn, +3 (2). (ED moe 40 
<J 


Pour des variables réparties suivant une loi voisine de la loi nor- 


male on peut utiliser la formule (11.4.7) et écrire l'expression (11.4.13) 
comme suit: 


D,= => (2) Da+r D (a) D, 


Ca 
+3 (2) 2... (41.4.14) 
i< 


Les deux derniers termes dans l’expression (11.4.14) sont la correc- 
tion due à la non-linéarité de la fonction et peuvent être utilisés 
pour estimer la précision de la méthode de linéarisation lors du calcul 
de la variance. 


CHAPITRE 12 


LOIS DE RÉPARTITION DES FONCTIONS 
DES ARGUMENTS ALÉATOIRES 


12.1. Loi de répartition d'une fonction 
monotone d'un argument aléatoire 


Dans les chapitres précédents nous avons étudié les méthodes de 
calcul des caractéristiques numériques des variables aléatoires; 
l'avantage essentiel de ces méthodes est de ne pas nécessiter la déter- 
mination des lois de répartition. Cependant parfois il est nécessaire 
de connaître non seulement les caractéristiques numériques mais 
également les lois de répartition des fonctions. 

Nous allons commencer par le problème le plus simple de ce type, 
à savoir le problème de la détermination de la loi de répartition d’une 
fonction d’un seul argument aléatoire. Les grandeurs aléatoires con- 
tinues se rencontrant le plus souvent dans les applications pratiques, 
nous allons commencer par elles. 

Soit une variable aléatoire continue X de densité de probabilité 
f (x) et une autre variable aléatoire Ÿ fonctionnellement liée à X 


par la relation 
Y = (À) *). 


11 y a lieu de trouver la densité de probabilité de Y. 
Considérons le segment (a, b) de l’axe des abscisses auquel appar- 
tiennent toutes les valeurs possibles de X, c’est-à-dire 


P(a<X<b) = 1. 


Dans le cas particulier où le domaine des valeurs possibles de X n'est 
pas limité on a a — — œ; b = + oc. 

La méthode de résolution de ce problème dépend du comporte- 
ment de la fonction ® sur le segment (a, b) : accroissement, décroisse- 
ment ou oscillation. 

Dans ce paragraphe nous allons envisager le cas où la fonction 
y = 9 (x) sur l'intervalle (a, b) est monotone **). Nous allons sépa- 
rément étudier deux cas: fonction monotone croissante et fonction 
monotone décroissante. 


*) La fonction @ est supposée continue et dérivable. 
*+) Le cas d’une fonction non monotone sera étudié dans le $ 12.3. 
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4. La fonction y = y (x) sur l'intervalle (a, b) est monotone crois- 
sante (fig. 12.1.1.). Lorsque X prend différentes valeurs sur l'inter- 
valle (a, b), le point aléatoire (X, Ÿ) ne se déplace que sur la courbe 
y = ® (x); l’ordonnée de ce point aléatoire est complètement déter- 
minée par son abscisse. 

Désignons par g (y) la densité de probabilité de Y. Pour trouver 
£ (y), nous allons tout d’abord trouver la fonction de répartition de Ÿ : 


G (y) = P (Y < y). 


Traçons la droite AB parallèlement à l’axe des abscisses à une 
distance y de celle-ci (fig. 12.1.1). Pour que la condition Ÿ < y 
puisse être remplie, il faut que le point aléatoire (X, Y) se situe sur 


Fig. 12.1.1 Fig. 12.1.2 


la portion de la courbe se trouvant au-dessous de la droite AB ; pour 
cela il faut et il suffit que la variable aléatoire X se trouve entre a 
et x, où z est l’abscisse du point d’intersection de la courbe y = (zx) 
avec la droite AB. Par conséquent : 


GW=P(Y<y)=P(a<X<2= | f(x. 


La limite supérieure z de l'intégrale peut s'exprimer en fonction de y: 


z = Ÿ (y), 


où 4 est la fonction inverse de @. On a alors: 
vw) 
GU)= | f(z)ar. (12.1.1) 


En dérivant l'intégrale (12.1.1) par rapport à la variable y figurant 
dans cette limite, on obtient: 


8 (y) = G° (y) = f (b (y)) Ÿ' G). (12.1.2) 
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2. La fonction y = œ (x) dans l'intervalle (a, b) décroît d'une 
manière monotone (fig. 12.1.2). Dans ce cas: 


bd b 
GH=P(F<y=P(r<X<b)= | f(hdr= | f(x) dr, 
x (y) 
d'où : 


g (y) = GG) = — f (4 (y)) p'(y). (12.1.3) 


En comparant les formules (12.1.2) et (12.1.3) on voit qu'elles 
peuvent être réunies en [une {seule : 


g (y) = f (b (y)) 1° (y) |. (12.1.4) 


En effet, lorsque croît, sa dérivée (donc également 4’) est posi- 
tive. Lorsque la fonction est décroissante la dérivée Ÿ’ est négative, 
par contre devant cette fonction on a dans la formule (12.1.3) le 
signe moins. Par conséquent, la formule (12.1.4) dans laquelle la déri- 
vée est prise en module est vraie dans les deux cas. Ainsi le problème 
de la recherche de la loi de répartition d’une fonction monotone se 
trouve résolu. 


Exemple. Soit x une variable aléatoire suivant une loi de Cauchy de 
densité de probabilité 


1 
FORGES 


Les variables X et Y sont liées par la relation: 
Y = 1 — X3. 


Trouver la densité de probabilité de Y. 

Solution. Comnrfe la fonction y = 1 — zx? est monotone sur l'intervalle 
(— oo. +) on peut appliquer la formule (12.1.4). Nous allons représenter 
la solution de ce problème sous la forme de deux tableaux, dans celui de gauche 
nous écrivons les fonctions figurant dans la solution générale du Droblèmé. 
dans celui de droite, les fonctions correspondant à l'exemple étudié: 


f (x) | TS 
y= (2) y—=1—7 
z—Ÿ (y) z=y 1—y 

Ÿ’ (y) a 

3 y (1—y)? 
, | 
| D" (y)! 374% 


1 
=f (by) 1%" (1 ae GAL TA VE 
sU= RUIVUIL US U+741=1) Arr 
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12.2. Loi de répartition d’une fonction linéaire 
d'un argument réparti suivant la loi normale 


Soient X une variable normale de densité 


(x—mzx)3 
__ À 77 20% 
1G= 7x (12.2.1) 
et Ÿ une variable aléatoire liée à X par la relation fonctionnelle li- 
néaire : 
Y = aX + b, (12.2.2) 


où a et b sont des coefficients non aléatoires. 

Il y a lieu de trouver la loi de répartition de Y. 

Nous allons écrire la solution sous la forme de deux tableaux com- 
me dans l'exemple du paragraphe précédent : 


= Em) 
f (2) VE 
y = (x) y= ax +b 
= ÿ (y) z= 1 
Ÿ” (y) 1 
[rh (y) n 


, : 1 = 
g(y)=/f(v(y))| +" (y)| = 2 


Après transformation g (y) devient : 
__{v-(amx+b)]3 
21al20% 


1 
= —— 0 
eu) lalox V2 
Cette expression n’est rien d'autre qu'une loi normale de paramètres : 
dy = am, + b, | 
Oy — | a | O>. 


(12.2.3) 


En passant des écarts quadratiques moyens aux grandeurs pro- 
portionnelles que sont les écarts probables on a: 


E,= lalE,. (12.2.4) 


On voit ainsi qu’une fonction linéaire d'un argument aléatoire 
suivant une loi normale, suit également une loi normale. Pour trouver 
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le centre de dispersion de cette loi, il faut dans l'expression de la 
fonction linéaire substituer à l'argument le centre de dispersion. 
Pour trouver l'écart quadratique moyen de cette loi il faut. multi- 
plier l’écart quadratique moyen de l’argument par le module du coef- 
ficient de l'argument dans l'expression de la fonction linéaire. Pour 
les écarts probables la règle est la même. 


12.3. Loi de répartition d’une fonction non monotone 
d'un argument aléatoire 


Soient À une variable aléatoire continue de densité de probabilité 
f (x) et Ÿ une autre variable liée à X par la relation fonctionnelle : 


Y = p(X), 


la fonction y — q (x) n'étant pas monotone sur l'intervalle (a, b) 
des valeurs possibles de l’argument (fig. 12.3.1). 


0 y)  2i(y) 25{v) Ay(9) 


Fig. 12.3.1 


Calculons la fonction de répartition G (y) de Y. Pour cela traçons 
de nouveau une droite 4B parallèle à l’axe des abscisses à une distan- 
ce y de celui-ci et considérons les portions de la courbe y = q (x) 
où on a Ÿ << y. Désignons par A, (y), A: (y) les intervalles correspon- 
dants de l’axe des abscisses. 

L'événement Y < y équivaut à ce que la variable aléatoire X 
se trouve dans l’un des intervalles A, (y), A2 (y), ... Ainsi: 


GW=P(Y<y=P((XCA(y)+(X € Ar(y))+...)= 
= PXCAG)=X | (ds. 
i i Aj{v) 


La fonction de répartition de la grandeur Y — œq (X) est donc 
donnée par la formule : 


G(y)=Y Î f (x) dz. (12.3.1) 


Î Ay(v) 
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Les limites des intervalles À, (y) dépendent de y et pour une forme 
donnée de la fonction y — (x) peuvent s'exprimer comme des fonc- 
tions explicites de y. En dérivant G (y) par rapport à y figurant dans 
les bornes des intégrales, on obtient la densité de probabilité de Y : 


g (y) = G (y). (42.3.2) 
E xemple. Soit une variable X équirépartie sur l'intervalle de + 


I 
à =: 


1 EL 
— pour [21 <+; 


f G)= ; 
O pour [z1> +. 


Trouver la loi de répartition de la grandeur 
Y = cos X. 


Solution. Traçons la courbe y = cos z (fig. 12.3.2). De toute évidence 
a 


onaa—=—,b— et sur l'intervalle (a. b) la fonction y = cos z n’est pas 


2 2 


monotone. 


g(y) 


JC x 0 I 4 
-+ ! 2 5 
Fig. 12.3.2 
En appliquant la formule (12.3.1) on a: 
x 
x! 2 
GW= | a+ (star. 
7 ze 
712 
Exprimons z, et r°: en fonction de y: 
Zy = —AIC COS Y; ZI: —= arc COS y, 
on obtient : 
x 
— arc COS y 2 
G (y) = | f(x) dr + | Î{ (x) dz. (12.3.3) 
arc cos y 


l 
QE 
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Pour trouver la densité g (y) nous n’allons pas calculer les intégrales dans 
la formule (12.3.3) mais dérivons directement cette expression par rapport 
à la variable y entrant dans les bornes des intégrales: 


EAU) G (= (are 08 D + re cos D | 
Comme f (x) — = on a: 
| 2 1 
RE  —— 12.3.4 
g(w)=— Vi ( ) 


Notons que la loi de répartition (12.3.4) pour Y n'est vraie qu'entre 0 et 1. 
c'est-à-dire dans les limites de variation de Ÿ = cos X quand X varie entre 
_ . et LE Hors de ces limites la densité g (y) est égale à zéro. 


Le graphique de la fonction g (y) est donné sur la figure 12.3.3. Pour y = 
= 14, g (y) tend vers l'infini. 


12.4. Loi de répartition d’une fonction 
de deux variables aléatoires 


Le calcul de la loi de répartition dans le cas d’une fonction de 
plusieurs variables est bien plus compliqué que dans celui d’une fonc- 
tion d’un seul argument. Nous allons exposer ici la méthode générale 
permettant de résoudre ce pro- 
blème pour le cas le plus simple 
de deux arguments. 

Considérons un système de 
deux variables aléatoires con- 
tinues (X, Ÿ ) de densité de 
probabilité f (x, y). La variable 
aléatoire Z est liée à X et Y 
par la relation fonctionnelle : 


Z = (x, Ÿ). 


Il y a lieu de trouver la 
loi de répartition de Z. | 

Pour résoudre ce problème y 
nous allons faire appel à une 
interprétation géométrique Fig. 12.4.1 
analogue à celle que nous 
avons utilisée dans le cas d’un seul argument. La fonction z = (x,y) 
sera maintenant représentée non pas par une courbe mais par une 
surface (fig. 12.4.1). 

Caléulons la fonction de répartition de Z: 


G(=P(Z<z = P(p(X, F)< 2). (12.4.1) 


Soit le plan Q parallèle au plan z0y situé à une distance z de celui- 
ci. Ce plan coupera la surface z = @ (z, y) suivant une certaine cour- 


Z-Y(F,Y) 


17 —2823 
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be C *). Projetons la courbe C sur le plan zOy. Cette projection dont 
l'équation est @ (x, y) = z divisera le plan x0y en deux domaines: 
pour l’un de ces domaines la cote de la surface examinée sera 
inférieure et pour l’autre supérieure à z. Désignons par D le 
domaine où cette hauteur est inférieure à z. Pour que l'inégalité 
(12 4.1) soit vérifiée, il faut que le point aléatoire (X, Ÿ) se trouve 
dans le domaine D ; par conséquent : 


G(=P((X, Y <D)= Î | f(x, y) dz dy. (12.4.2) 


(D) 


Dans l’expression (12.4.2) la grandeur z entre implicitement par 
l'intermédiaire des limites. 
En dérivant G (z) par rapport à z on obtient la densité de proba- 
bilité de Z: 
g (2) = G (2). 


Connaissant la forme de la fonction z — (zx, y) on peut exprimer 

les limites d'intégration en fonction de z et expliciter g (z). 
Pour trouver la loi de répartition d’une fonction de deux argu- 
ments on n’a pas besoin de cons- 


4 truire chaque fois la surface z — 

; = p (z,y) comme sur la figure 

; 12.4.1 ni de la couper par un plan 

L parallèle à zOy. Il suffit de tracer 

) zy=7 dans le plan z0y une courbe 

7 Id’équation z = ® (x, y), de noter 
Z 7, de quel côté de cette courbe on 
Z a Z <zet de quel côté Z > z et 


a æ d’intégrer sur le domaine D où 
Z Z € z. 
Tÿ"2 7 Exemple. Soit un système 
4 de variables (X, Y) de loi de répar- 
5 tition f (z. y). Z est le produit des 
; variables X, Y: 
Z = XY. 
Fig. 12.4.2 Trouver la densité de probabilité de Z. 


Solution. Fixons-nous une 

certaine valeur z et construisons sur 
le plan z0Oy une courbe d'équation ry = z (fig. 12.4.2). C'est une hyper- 
bole ayant pour asymptotes les axes de coordonnées. Le domaine D sur la 
figure 12.4.2 est hachuré. 


*) Sur notre figure La courbe C est fermée; en général, elle peut ne pas 
être fermée et se composer de plusieurs branches. 
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La fonction de répartition de Z s'écrit: 


0 © oo 2/x 
cw= (se nés dy= | j 16e y) az ay+ | | ft mazda. 
(D) — 00 z/x 0 — 
En dérivant cette expression par rapport à z on a: 
0 œ 
se | Lr(r+)at | Li(s<)é. (243 
ne ) 


12.5. Loi de répartition de la somme 
de deux variables aléatoires. Composition 
des lois de répartition 


Nous allons utiliser la méthode générale exposée ci-dessus pour 
tésoudre un problème particulier important pour les applications pra- 
riques. 11 s’agit de la recherche de la loi de répartition de la somme 
de deux variables aléatoires. 


Fig. 12.5.1 


Soit un système de deux variables aléatoires (X, Y} de densité 
de probabilité f (x, y). Considérons la somme 


Z=X+Y 


pour laquelle nous allons trouver la loi de répartition. Pour cela tra- 
çons dans le plan xz0y la droite d'équation x + y = z (fig. 12.5.4). 
C'est une droite coupant sur les axes des segments de même longueur 
z et divisant le plan zOy en deux parties ; à droite et au-dessus de cette 
droite À + Ÿ => z; à gauche et au-dessous À + Y << z. Le domaine 
D est ici la partie inférieure gauche du plan x0y hachurée sur la figu- 


17* 
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re 12.5.1. En vertu de la formule (12.4.2) on a: 


G(2)= \ HE y) dx dy = ( re y) dx dy = 
(D) — 00 —00 


. Î si y) dy} de. 


En dérivant cette expression par rapport à la variable z entrant dans 
la limite supérieure de l'intégrale interne on a: 


g (z) = Î f(x, z—2x) dx. (12.5.1) 


C’est une forme générale pour la densité de probabilité d’une som- 
me de deux variables aléatoires. 

Vu que le problème est symétrique par rapport à X et Y on peut 
écrire cette formule sous la forme: 


g(2)= ( f(z—y, y) dy, (12.5.2) 


équivalente à la première et pouvant être utilisée à sa place. 

Pour les applications pratiques le cas des variables aléatoires 
(X, Y) indépendantes est très important. On parle alors de compo- 
sition des lois de répartition (ou de convolution). 

Composer deux lois de répartition veut dire trouver la loi de ré- 
partition que suit la somme de deux variables aléatoires indépendantes 
en question. 

Nous allons trouver la formule de composition de deux lois de 
répaftition. Soient z et y deux variables aléatoires indépendantes 
de lois f, (x) et f2 (y); trouver la composition de ces lois, c’est-à-dire 
trouver la densité de probabilité de la grandeur 


Z=X<+Y. 
Les variables X et Y étant indépendantes, on a: 
f (x, y) = fi (à) f2 (y) 
et les formules (12.5.1) et (12.5.2) s'écrivent alors: 


eU)= | hf G—2) dr, (12.5.3) 


= | hi G—7 (y dy. (12.5.4) 


00 
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Pour désigner la composition des lois de répartition on utilise 
souvent la notation symbolique : 


g = fifa 


où = est le symbole de composition (de convolution). 

Les formules (12.5.3) et (12.5.4) ne sont commodes que si les lois 
fi (x) et f2 (y) (ou tout au moins l’une d'elles) sont données par une 
formule unique dans toute la gamme des valeurs de l'argument 
(de — co à æ). Si au contraire les deux lois sont données dans les 
différents domaines par des équations différentes (par exemple, deux 
lois de densité uniforme) il est plus commode d'utiliser directement 
la méthode générale exposée au $ 12.4, c’est-à-dire de calculer la 
fonction de répartition G (z) de la grandeur Z = X “+ Y et de prendre 
la dérivée de cette fonction. 


Exemple 1. Réaliser la composition de la loi normale 


(x—-m)2 
1 7 202 
fi (z)= os V2x * 
et de Ja loi uniforme 
1 
f2 (y) = Ba pour a € y <P. 


Solution. Nous allons appliquer la formule de composition des lois 
de répartition (12.5.4): 


i B ; _G=v-m} ; b ; _{v-G-m)} 
203 203 
2)= e dy = | ——— € dy. 
Rp a J o V2x pa J oV2x : 
(12.5.5) 


La fonction sous l'intégrale dans l’expression (12.5.5) n'est rien d'autre qu’une 
loi normale dont le centre de dispersion est : — m et l’écart quadratique moyen 0, 
l'intégrale dans l'expression (12.5.5) est la probabilité pour la variable aléa- 
toire suivant cette loi de se trouver dans l'intervalle de & à B; par conséquent : 


cpl [or (ÉEN)0 (En) 


B—« re] 


Sur la figure 12.5.2 on peut trouver les graphiques des lois f, (x), f2 (y) et 
g (z) pour a = —2, B = 2, m = 0, & = i. | 

Exemple 2. Trouver le produit de composition des deux lois suivan- 
tes de densités uniformes définies sur le même intervalle (0, 1): 


fs (x) = 1 pour 0 <z<i1, 
f2 (y) = 1 pour 0 < y < 1. 


Solution. Les lois f; (r) et f2 (y) n'étant données que sur certains in- 
tervalles des axes Oz et Oy, pour résoudre ce problème il vaut mieux d'utiliser 
la méthode générale exposée dans le 8 12.4 et non pas les formules (12.5.3) 
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- MC trouver la fonction de répartition G (z:) de la grandeur 


Considérons le point aléatoire (X. Y) dans le plan zOy. Le domaine où 
peut se trouver ce point est le carré R de côté égal à 1 (fig. 12.5.3). On a: 


c@= | (rte à a ay= ff asav, 
(D) (D)] 


où le domaine D est la partie du carré R se trouvant à gauche et au-dessous 
de la droite z + y = z. 11 est évident que 


G (z) = S D» 


où Sh est l'aire du domaine D. 


Fig. 12.5.2 Fig. 12.5.3 


Ecrivons l'expression de l'aire du domaine D pour différentes valeurs 
de s en utilisant à cette fin les figures 12.5.3 et 12.5.4: 


z2> 2 


RU en 
E<0 | G(:)=0 
0<z<1 C(=È | 
1<:<2 | G(n=1— 2 
| 
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En dérivant ces expressions on obtient: 


8 (2) 


z<0 | g(z)=0 
0<z<1 | g(z)=z2 
1<:<2 | g(2)—2—3 

1> 2 g(2)=0 


Le graphique de la loi de répartition g (z) est donné sur la figure 12.5.5. 
Cette loi s'appelle loi de Simpson ou loi du triangle. 


Fig. 12.5.5 


12.6. Composition des lois normales 


Soient À et Ÿ deux variables aléatoires indépendantes réparties 


suivant les lois normales : 
mn 


h(a=— = 2e (12.6.1) 
. (-my}3 
hU)=— 7° Fu (12.6.2) 


I1 y a lieu d'effectuer la composition de ces lois, c’est-à-dire de 
trouver La loi de répartition de la grandeur 
Z=X<+Y. 
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Appliquons la formule générale (12.5.3): 


ns (x-mr)t _{G-x-my} 


eu=fh@he-naes te fe 6 2 à 
ou …: (12.6.3) 


En ouvrant les parenthèses dans l’exposant de la fonction sous 
l'intégrale et en simplifiant on obtient: 


die” + pus 


où 


Substituons ces expressions dans la formule (9.1.3), il vient: 


a AC-—B? 


f o-assrne-car = Le 4, (12.6.4) 


et, après transformations : 
[z—-(mx+muy)]3 


= 1 1, 2(0:+01) 
8(z)= VE Vs" Dons (12.6.5) 


ce n’est rien d'autre qu'une loi normale de centre de dispersion 


M, = Me + My (12.6.6) 
et d'écart quadratique moyen 
O, = V 0 + oi. (12.6.7) 


Les raisonnements qualitatifs suivants permettent d'arriver à 
la même conclusion bien plus rapidement. 

Sans ouvrir les parenthèses ni effectuer les transformations dans 
la fonction sous l'intégrale de (12.6.3) on voit immédiatement que 
l’exposant est un trinôme en x de la forme: 


p(z) = — Am +2Bz—C, 


où le coefficient À ne contient pas z, le coefficient B lui est propor- 
tionnel, et le coefficient C proportionnel à son carré. Utilisant la 
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formule (12.6.4) on voit ainsi que g (z) est une exponentielle dont l’ex- 
posant est un trinôme en z; or, la densité de probabilité de cette forme 
correspond à la loi normale. On arrive ainsi à une conclusion pure- 
ment qualitative : la loi de répartition de la variable z doit être nor- 
male. 

Pour trouver les paramètres de cette loi, à savoir m, et ü,, nous 
allons utiliser le théorème de composition des espérances mathé- 
matiques et le théorème de composition des variances. En vertu du 
premier théorème : 


M; = My + My (12.6.8) 
et en vertu du second : 
D, “ D, nE D ,, 
ou 
0? == 0% + 0?, (12.6.9) 


d’où la formule (12.6.1). 
En passant des écarts quadratiques moyens aux écarts probables 
qui leur sont proportionnels on obtient: 


Et+ Ei+ Eë. (12.65.10) 


On arrive ainsi à la règle suivante : La composition des lois normales 
est une loi normale, les espérances mathématiques et les variances (ou 
les carrés des écarts probables) étant la somme des grandeurs correspon- 
dantes. 

La règle de composition des lois normales peut ètre généralisée 
au cas d’un nombre arbitraire de variables aléatoires indépendantes. 


Soient : 
Xi, À, . 9 Xn 


n variables aléatoires indépendantes normales dont les moyennes 
sont : 


PTE Mxos ..…. Mrn 
et les écarts quadratiques moyens : 


Oxys Oxos ee) Oxn? 
la grandeur 


Z= > X: 


i=1 


suit également une loï normale de paramètres : 


M= D Mr, (12.6.11) 


ici 


n 
ci= ÿ, 02. (12.6.12) 
=1 
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Au lieu de la formule (12.6.12) on peut utiliser la formule équi- 
valente : 


Ei= D Ex, (12.6.13) 
CS | 


Si le système de variables aléatoires (X, Y) est réparti suivant 
une loi normale mais À et Ÿ sont liées, on peut comme auparavant 
montrer que, partant de la formule générale (12.5.1), la loi de répar- 
tition de la grandeur: 

Z=X+Y 


est également normale. Les moyennes s’ajoutent algébriquement, 
mais pour les écarts quadratiques moyens la règle de composition 
est plus compliquée; on a: 
02— 07 + 0% + 2r0x0y) (12.6.14) 
où r est le coefficient de corrélation des variables X et Y. 
Lorsque l'on ajoute plusieurs variables aléatoires interdépendan- 


tes normales, la loi de répartition de la somme est également une loi 
normale de paramètres : 


M = > Mz, , (12.6.15) 
ñn 
= Ÿÿ ,+22 Ti10x 0x) (12.6.16) 
i=1 ii 
ou pour les écarts probables 
Ei= 2 E,+2 2 ruExEey (12.6.17) 


où r;, est le coefficient de corrélation des variables X;, X;, la som- 
mation s'étendant à toutes les combinaisons deux à deux des varia- 
bles X:, X°, ET Xn. 

Nous venons de voir une propriété très importante de la loi nor- 
male : la composition de lois normales est une loi normale. C'est la 
propriété dite de stabilité. Une loi de répartition est dite stable si lors 
de la composition de deux lois de ce type on obtient une loi de même 
type *). Ci-dessus nous avons montré que la loi normale est stable. 
Peu de lois de répartition sont douées de la propriété de stabilité. 
Dans le précédent paragraphe (exemple 2) nous avons vu par exemple 
que la loi uniforme n'est pas stable: par composition de deux lois 
uniformes données dans les intervalles de 0 à 1 on obtient la loi de 
Simpson. 


*) On entend par lois du même type, des lois différant les unes des autres 
par les échelles et l’origine sur l'axe des abscisses. 
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La loi normale doit sa grande popularité à cette propriété de sta- 
bilité. Cependant, d’autres lois sont également douées de cette pro- 
priété. La loi normale a ceci de ; 
particulier que lors de la composi- 
tion d’un nombre suffisamment 
grand de lois arbitraires, la « loi 
produit » est aussi voisine que l’on gs 
veut de la loi normale, quelles que 
soient les lois de répartition des 
composantes. On peut montrer ceci : 
sur l'exemple de la composition de 2% n 2 3 
trois lois uniformes données sur les Fio. 126.1 
intervalles de 0 à 1. La loi de répar- ‘8: 
tition g (z) ainsi obtenue est montrée sur la figure 12.6.1. On voit 
que le graphique de la fonction g (z) rappelle la loi normale. 


12.7. Fonctions linéaires d'arguments 
normalement répartis 


Soit un système de variables aléatoires (X,, X2, ..., X,) norma- 
les ; la grandeur aléatoire Ÿ est une fonction linéaire de ces variables : 


Y = 2 aiXi+b. (12.7.1) 


I1 y a lieu de trouver la loi de répartition de Y. 

Il est facile de voir que c’est une loi normale. En effet, la gran- 
deur Ÿ est une somme de fonctions linéaires dont chacune dépend d'un 
seul argument X normal, et comme nous l'avons montré ci-dessus, 
cette fonction linéaire suit également une loi normale. En ajoutant 
plusieurs grandeurs normalement réparties on obtient de nouveau 
une grandeur normale. 

Il ne reste plus qu’ à trouver les paramètres de la loi de Y, à savoir, 
la moyenne M y et l'écart quadratique moyen o,. En appliquant les 
théorèmes de l'espérance mathématique et de la variance on obtient : 


My = à aix, +b, (12.7.2) 
n 
0 — 2 ao, +2 À ajri50= 0x) (12.7.3) 


où r:, est le coefficient de corrélation des grandeurs X;, À}. 
Lorsque les variables (X;,, X2, . .., À,) ne sont pas corrélées 
(donc, indépendantes pour la loi none) la formule (12.7.3) devient : 


oy= : atox,. (12.7.4) 
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Dans les formules (12.7.3) et (12.7.4) les écarts quadratiques 
moyens peuvent être remplacés par les écarts probables qui leur sont 
proportionnels. 

Dans les applications pratiques souvent on rencontre des cas où 
l'on ne connaît pas exactement les lois de répartition des variables aléa- 
toires X1, X2, . .., À, figurant dans la formule (12.7.1), mais seu- 
lement leurs caractéristiques numériques, à savoir l'espérance mathé- 
matique et la variance. Si les variables X,, X:, ..., X, sont de 
plus indépendantes et leur nombre suffisamment important, on 
peut affirmer que quelles que soient les lois de répartition des 
Xi, la grandeur Y suit une loi voisine de la loi normale. En fait, pour 
obtenir la loi de répartition pouvant être approximativement consi- 
dérée comme hormale, il suffit, en général, de 5 à 10 composantes 
dans l'expression (12.7.1). Ceci n’est plus vrai lorsque la variance de 
l’une des composantes dans la formule (12.7.1) prédomine ; on sup- 
pose que les variances des termes de la somme (12.7.1) sont d’un 
même ordre de grandeur. Ces conditions étant observées, on peut 
adopter approximativement pour la grandeur Ÿ une loi normale dont 
les paramètres sont donnés par les formules (12.7.2) et (12.7.4). 

Il est évident que tous les raisonnements ci-dessus concernant la 
loi de répartition d’une fonction linéaire sont vrais (bien sûr, appro- 
ximativement) lorsque la fonction n'est pas tout à fait linéaire mais 
peut être linéarisée. 

Exemple. Pour faire son point un avion mesure la distance le séparant 
de deux repères se trouvant environ à 50 km à l’ouest et à 400 km au sud-ouest. 
Les erreurs de mesure sont indépendantes et caractérisées par un écart quadra- 
tique moyen égal à 100 m; les erreurs systématiques sont exclues. Trouver les 
paramètres de la loi de répartition de l'erreur de position de l’avion. 

Solution. Prenons l’axe des abscisses dirigé vers l’est et celui des 
ordonnées vers le nord. Désignons par (a. b;1). (a2, b2) les coordonnées des re- 
pères; la position de l'avion est représentée par le point (x, y). Les distances 
vraies aux repères sont respectivement V G& — 4) E (y — b;)3, 
V'(& — at + (y — b2)*; les distances mesurées sont égales aux distances 
vraies plus l'erreur: 


R= VE 0024 b1)2+ AR, (12.7.5) 
R;= V(—01)1+(y—b2)2+AR:, 


AR, et AR, sont ici indépendants. | | 
Les équations donnant X, Y de l’avion en fonction des distances mesurées 


so nt : 
(z—a1)2+(y—b1)?2=R}, 
(z— a2)2+ (y —b2)2=R3, 
ou conpte tenu de (12.7.5), 
(z— @)2+ (y —b3)2=(z— 03) + (y —b1)2+ 
+2 Via—a1)2+(y—b3:)2AR1+(AR3)?, 
(z—02)2+(y—d2)2—=(z—02)7+ (y —b3)3+ 


| (12.7.6 
+2 V(z—a)2+(y—0b2) AR:+(AR2)2. | 
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Ecrivons les coordonnées X, Y données par le système (12.7.6) comme 
suit: X = z + AX. Ÿ — y + AY, AX, AY étant les erreurs. et linéarisons 
fe système. Après simplifications nous avons: 

2(z—a;)-AX +2 (y—0b5)-AY 2 V/{(z—a1)2+ (y —bi)2.AR1, 


2(z—a2)-AX +2 (y—b2) AY & 2 V(zx—a2)2+(y—b2)2-AR2. 


Comme nous connaissons approximativement les directions des repères 
et leurs distances, nous pouvons écrire: 


z— a = 50 (km). y — b = 0, 
z—@=y—b = 50 V2 (km). 
Le système (12.7.7) s'écrit alors comme suit: 


1004AX = 100AR1. | 
100 V2 AX + 100 V/2 AY = 2004R:. 


(12.7.7) 


d’où: 
Fi A AR:. 
ms V2 AR: — AR: 


Les espérances red des erreurs sont nulles (erreurs systématiques 
absentes). Les éléments de la matrice de corrélation sont 


GÂx = 074 — 10 000, Cax=—=100 (m) ; 
OÂy = 2072 + O4 — 30 000, Guy = 173 (m) ; 
Kaxay= — 073 = — 10 000. 
Le coefficient de corrélation est égal à: 


ee D 
SAUT 100.400 V3 V3 0 971. 


12.8. Composition des lois normales 
dans le plan 


Soient deux vecteurs aléatoires indépendants donnés dans Île syste- 


me zOy: V, de composantes (X,, Ÿ.) et V: de composantes (X:, ŸY'>) 
Supposons que chacun d'eux soit normalement réparti, les paramè- 
tres du premier vecteur étant mx, My,, Oxy Om lun €t Ceux du se- 
cond Mxss Myss Oxer Over lxavs Trouver la loi de répartition du vec- 


teur Ÿ — ÿ, + V: (fig. 12.8.1) de composantes 
X = X1 + X2; 
Y — Ÿÿ: + Y 2. 
Il est facile de démontrer qualitativement (comme nous l’avons 
fait pour la composition de deux lois normales au $ 12.6) que le 


vecteur V est également normalement réparti. Adoptons cette asser- 
tion sans démonstration. 
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Nous allons maintenant trouver les paramètres de la loi de répar- 


tition du vecteur V. En vertu du théorème de la somme des espérances 
mathématiques on a: 


Fu . ss | (12.8.1) 
Puis, en vertu du théorème de la somme des variances : 
OX = 07, + 02,» 
0ù= 0, + 0ÿ. | (12.8.2) 


Et enfin, en vertu du théorème de la somme des covariances : 
K>y _— Kzv + Kxy. 
ou, en passant aux coefficients de corrélation : 
TxyOxOy = Tæv,OxOv, « Tx,v,0x Ou 2° 
d’où 
TE 7 ROUE (12.8.3) 
CE TE ) (oÿ 47 90) 


Ainsi les formules (12.8.1), (12.8.2) et (12.8.3) permettent de 
résoudre le problème de composition des lois normales. 


Fig. 12.8.1 


Ces formules ont été démontrées pour le cas où les deux lois nor- 


males initiales (pour les vecteurs V, et V2) sont données dans le même 
système de coordonnées 20y. Parfois il y a lieu de composer deux 
lois normales dans le plan, chacune étant donnée dans son propre 
système de coordonnées, à savoir dans ses axes principaux de l’ellipse 
de dispersion. Nous allons donner une méthode de composition des 
lois normales pour ce cas. 
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Supposons que, dans le plan z0y (fig. 12.8.2) on ait deux vecteurs 


aléatoires non corrélés normalement répartis V, et V.. Chacun de ces 
vecteurs est caractérisé par son ellipse unitaire de dispersion; le 


vecteur V, par l’ellipse de centre au point m.,, m,, et de demi-axes 
Oti» On, dont le premier forme avec l’axe Oz l'anglé a; ; les caracté- 


—+ 
ristiques analogues du vecteur V, seront m,,,Mm,,, Ots» Om, G2. Trouver 


Fig. 12.8.2 


les paramètres de l’ellipse unitaire de dispersion caractérisant le vec- 
teur V = V, + V:. Nous désignerons ces paramètres 
Mrs Mys Oxr Oys À: 

La position du centre de dispersion ne dépendant pas du choix 
du système de coordonnées, on aura donc comme auparavant les rela- 
tions : 

Mz=Mz, + Max, 

Pour trouver les éléments de la matrice de corrélation du vecteur 
V, nous allons projeter les points aléatoires correspondant aux vec- 
teurs V, et V, sur les axes Oz et Oy. En vertu des formules (10.3.3) : 

0%, = o, cos? &, + (UR sin° &, 

Oy, = 0, sin? &; + 01, cos? &,, 
OX. — OË cos? &> + On, Sin? Per0c) 
Sn 27 On, SM 
Où, = OË, Sinz G2 + On, COS” Gz. 

Les coefficients de corrélation des composantes des vecteurs ÿ, 
et V, dans le système de coordonnées z0y sont donnés par la relation 
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(9.2.2) : 
tg 201 (0% — 0, ) 
zu, Zn. , 
1 222 (où — 0} (12.8.5) 
Txus — 20, 3, 
X2 Va 


La composition des lois normales dans le plan revient ainsi au 
problème précédent. Connaissant 0, 04, r.y on peut à l’aide de la 
formule (9.2.2) trouver les angles formés par les axes de l’ellipse 
somme avec l'axe des abscisses : 

2rxyOxOy : 


Lan Te) (12.8.6) 


x — Oy 


et à l’aide des formules (9.2.4) les écarts quadratiques moyens: 


Og = V oxcos a +r,,0:0, Sin 20 + 0} sin? «, 


| (12.8.7) 
On = V oisin?a—r,,0,0, sin 2a + 04 cos a. 

Les dernières relations sont vraies non seulement pour les écarts 
quadratiques moyens mais également pour les écarts probables qui 
leur sont proportionnels : 


E; = V Ejcos’ a --r,,E.E, sin 2a + Eï sin’ a, 
E,=VEisin®a—r,,E,.E, sin 2a + E; cos’ a 


Nous allons passer maintenant à la composition d'un nombre 
quelconque de lois normales dans le plan. 

Le cas le plus simple de composition d’un nombre quelconque 
de lois normales ést celui où les axes principaux de dispersion pour 
toutes les lois entrant dans la composition sont parallèles. En choi- 
sissant les axes de coordonnées parallèlement à ces axes principaux 
de dispersion, nous aurons alors des systèmes de variables aléatoires 
indépendantes, la composition des lois normales sera donnée par les 
formules simples suivantes: 


(12.8.8) 


= 2 Max, wx 2 UR 5 
ne = (12.8.9) 
My — 2 My, $ y a 2 Où» 


*) La tangente ayant pour période x, les valeurs de « données par la for- 
mule (12.8.6) peuvent différer de + , Ce qui correspond à deux axes principaux 
de l’ellipse. 
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OÙ Oxs Oxyr Oys Oy, SONt les écarts quadratiques moyens principaux 
des lois correspondantes. 

Lorsque les directions des axes principaux diffèrent, on peut trou- 
ver la composition de plusieurs lois normales par la méthode utilisée 
pour le cas de deux lois, c'est-à-dire en projetant les vecteurs aléa- 
toires à additionner sur les axes d'un même système de coordonnées. 

Dans les applications on rencontre souvent des lois dites 
dégénérées, c'est-à-dire des lois caractérisées par une ellipse de dis- 
persion n’ayant qu'un seul demi-axe, l’autre étant nul. Ces lois dégé- 
nérées donnent la dispersion dans une seule direction. Lors de la 
composition de ces lois il y a lieu de procéder comme dans le cas des 
lois ordinaires et supposer certains paramètres (écarts moyens 
quadratiques ou probables) nuls 


Exemple 1. Un parachutiste saute d'un aérostat et essaie d atterrir 
en un certain point. L erreur du point d'atterrissage se compose 

4) de l'erreur liée à ce que la direction et la vitesse du vent sont différen- 
tes aux différentes altitudes; 

2) des erreurs dues à d’autres causes. 

Ces deux groupes d’erreurs sont indépendants. Les axes principaux de la 
dispersion. due au fait que l’on a mal tenu compte du vent, sont dirigés dans 
le sens du vent et perpendiculairement, les écarts dratiques moyens prin- 
cipaux sont respectivement 20 et 10 m; les erreurs dues à d’autres causes don- 
nent une ellipse unitaire qui est un cercle de rayon égal à 15 m. Les erreurs 
systématiques sont exclues. Trouver les paramètres de la loi normale que suit 
l'erreur totale du point d'atterrissage. 

Solution. Nous allons diriger l’axe Oz suivant la direction dominante 
du vent et l'axe Oy. perpendiculairement. En appliquant la règle de compo- 
sition des lois normales à composantes indépendantes on a {formules (12.8.9)]: 


Me =My=0 
o2—207+4152— 625, Cx—=25m 
05-=10"+15=—325,  o, = 18m 


Exemple 2. Dans les conditions de l'exemple 1 du 8 12.7 un avion 
jette sur la terre une caisse avec des appareils. La dispersion du point d'atter- 
rissage de la caisse due à des causes techniques est circulaire, l’écart quadra- 
tique moyen étant égal à 70 m et l'erreur systématique étant 30 m déplacée 
vers le nord (direction du vol de l'avion). Trouver les paramètres de la loi de 
répartition de l'erreur (AX. AY) du point d'atterrissage de la caisse due à des 
causes techniques et à l’imprécision de la détermination des coordonnées de 
l'avion: rapporter cette répartition aux axes principaux. 

Solution. Désignons par AX:. AY: l'erreur due à l’imprécision des 
coordonnées; par AX2, AY: l'erreur due à des causes techniques. Les paramè- 
tres de ces composantes sont: 


Max, = May, = Max, 0 may, =30 ; 
O&x, — 10 000, y, = 30000, Ka ay, = — 10 000 ; 
Tr, = y, 4900,  Kax ay, —0. 


18—2823 
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En appliquant les théorèmes de la somme des espérances mathématiques, 
des variances et des covariances on obtient : 


max—=0, may —=30 ; 
0Ë,—14 900,  oaz# 122 (m); 
0%, =3%4 900, day & 187 (m). 
KAzAy = — 10 000. 
Le coefficient de corrélation est: 
— 10 000 
TAxAY— "129.187 


Calculons l’angle « formé par l'axe des abscisses et le premier axe prin- 
cipal de dispersion: 


= — 0,44. 


2a = 45°, œ — 22°30'. 
En vertu des formules (12.8.7) on a: 
= V0, cos? à + Æ ax ay Sin 2a + 04,,sin? a & 104 (mn); 


On = V 0Âx Sin? — K Axay Sin 2a + 04, cos? a & 198 (m). 


Ainsi, le petit axe de l'ellipse de dispersion fait 22°30’ avec la direction: 
est-ouest et le grand axe, 112°30”. 


CHAPITRE 13 


THÉORÈMES LIMITES DE LA THÉORIE 
DES PROBABILITÉS 


13.1. Loi des grands nombres et théorème 
central limite 


Au début de ce cours nous avons déjà noté que les lois mathé- 
matiques de la théorie des probabilités ont été obtenues en se basant 
sur les lois statistiques réelles propres aux phénomènes aléatoires 
d'attente. Ces lois sont liées au fait que dans les phénomènes d'’atten- 
te on a un grand nombre d'expériences semblables ou la somme d’un 
grand nombre d'actions aléatoires, dont l’ensemble donne naissance 
à une grandeur aléatoire régie par une certaine loi. Dans l’antiquité 
on connaissait déjà la propriété de stabilité des phénomènes aléatoi- 
res ayant lieu en masse. Quelle que soit l’origine du phénomène, les 
particularités de chaque action aléatoire n'influent presque pas sur 
le résultat moyen de ces effets; des écarts aléatoires par rapport à 
la moyenne, inévitables pour chacun des e‘fets, se trouvent compensés, 
nivelés, lissés dans leur masse. C’est cette stabilité de la moyenne 
qui représente le sens physique de la « loi des grands nombres » dans 
le sens général : lorsque le nombre des effets est très important leur 
résultat moyen cesse pratiquement d'être aléatoire et peut être prédit 
avec une très grande précision. 

Dans le sens strict, en théorie des probabilités on entend par « loi 
des grands nombres » une série de théorèmes mathématiques, établis- 
sant chacun le fait que, pour telles ou telles conditions, les caracté- 
ristiques moyennes d’un grand nombre d'expériences tendent vers 
certaines constantes. 

Dans le $ 2.3 nous avons déjà formulé le théorème le plus simple 
de ce genre, à savoir le théorème de Bernoulli, en vertu duquel, la 
fréquence d’un événement, lors d’un grand nombre d'expériences, 
tend (ou, plus exactement, converge en probabilité) vers la probabili- 
té de cet événement. Dans ce chapitre nous allons étudier des formu- 
les plus générales de la loi des grands nombres. Toutes ces formules 
établissent le fait et les conditions de convergence en probabilité 
de telles ou telles grandeurs aléatoires vers des grandeurs constantes, 
non aléatoires. 

La loi des grands nombres joue un rôle important dans les appli- 
cations pratiques de la théorie des probabilités. Le fait que les gran- 


18° 
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deurs aléatoires se comportent dans certaines conditions pratique- 
ment comme des grandeurs constantes permet de les utiliser, de pré- 
dire les résultats des phénomènes aléatoires ayant lieu en masse avec 
certitude. 

Les possibilités de ces pronostics concernant les phénomènes 
aléatoires de masse se trouvent élargies grâce aux théorèmes limites 
relatifs non pas aux valeurs limites des grandeurs aléatoires, mais 
aux lois de répartition limites. Il s’agit d’un groupe de théorèmes 
généralement appelés « théorème, central limite ». Nous avons déjà 
noté que, sous certaines réserves, la loi de la somme d’un nombre suf- 
fisamment grand de variables aléatoires tend indéfiniment vers la 
loi normale. Ces conditions qui, du point de vue mathématique, peu- 
vent se formuler différemment, sous une forme plus ou moins générale, 
signifient en fait que l'influence des composantes sur la somme 
est infiniment petite, c'est-à-dire que la somme ne contient pas de 
termes dont l'influence sur la dispersion de la somme est prédomi- 
nante. Les différentes formes du théorème central limite diffèrent 
entre elles par les conditions pour lesquelles ces propriétés limites ont 
lieu. 

Les différentes formes de la loi des grands nombres et celles 
du théorème central limite forment l'ensemble des théorèmes limites 
de la théorie des probabilités. Les théorèmes limites permettent non 
seulement de faire des pronostics scientifiques dans le domaine des 
phénomènes aléatoires, mais également d'estimer la précision de ces 
pronostics. 

Dans ce chapitre nous n’envisagerons que les formes les plus sim- 
ples des théorèmes limites. Nous étudierons d’abord les théorèmes 
du groupe de la « loi des grands nombres », puis les théorèmes du 
groupe du « théorème central limite ». 


13.2. Inégalité de Tchébychev 


Nous allons démontrer une inégalité très générale connue sous le 
nom d’inégalité de Bienaymé-Tchébychev, qui servira de lemme pour 
la démonstration des théorèmes du groupe de la « loi des grands 
nombres ». 

Soit À une variable aléatoire d'espérance mathématique m. 
et de variance D... Selon l'inégalité de Tchébychev pour tout nombre 
réel positif &, la probabilité pour que X s’écarte de son espérance 
mathématique d’une grandeur non inférieure à &, a pour limite supé- 


rieure —+ : 
œ 


P(IX—m;,|>a) << . (13.2.1) 
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Démonstration. Soit À une variable discrète, répartie 
comme suit : 


Z | z, | Za | LT: 


ps | Pi | Pa |... | p, 


Nous allons représenter les valeurs possibles de X et son espé- 
rance mathématique m, par des points sur l'axe numérique Oz 
(fig. 13.2.1). 


L: 4 Mr æ 
Pt, L 
OZ, I3 Ty À B Zo-1#n 
Fig. 13.2.1 


Soit une certaine valeur & => 0 et calculons la probabilité pour 
que X s’écarte de son espérance mathématique d’une grandeur non 


inférieure à «à: 
P(|IX—-m,|> a). (13.2.2) 


Pour cela nous portons à droite et à gauche du point m, un seg- 
ment de longueur a ; on obtient ainsi l’intervalle AB. La probabilité 
(13.2.2) n’est rien d’autre que la probabilité pour le point aléatoire X 
de se trouver à l’extérieur de l'intervalle AB: 


P(X—m:|>a)=P(XŒE AB)*). 


Cette probabilité est la somme des probabilités de tous les z, se 
trouvant à l'extérieur de l'intervalle AB: 


P(IX—m|>a)= 2 pu (13.2.3) 


lx-m, 12e 


où la notation | z; — m,| > & signifie que la sommation s’étend à 
tous les i pour lesquels les points zx, se trouvent à l'extérieur de l’inter- 
valle AB. 

D'autre part, écrivons l'expression de la variance de X. Par défi- 
nition 


D,=M [(X—m.)*] = > (Zi —m) pi = ÿ Zi— Max ps  (13.2.4) 


Tous les termes de la somme (13.2.4) étant non négatifs, cette der- 
nière ne peut que diminuer lorsqu'on la calcule non pas pour toutes 
les valeurs de z;, mais seulement pour certaines d’entre elles, en par- 


*) Les extrémités de l'intervalle AB ne lui appartiennent pas. 
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ticulier, pour celles se trouvant à l'extérieur de l'intervalle AB : 
D, > ÿ |zi— ms pi (13.2.5) 


] Xy— mn, |1>a 


Remplaçons dans la somme l'expression |z;, —m,| par «. 
Comme pour tous les termes de la somme on a [zx —m.|>a, 
la substitution mentionnée ci-dessus ne peut que diminuer la somme; 
par conséquent : 

D,> DZ) œp;=at ÿ Pie (13.2.6) 


1x;-m,|2a Ix;-mn, Ra 
Mais, en vertu de la formule (13.2.3), la dernière somme de (13.2.6) 


n’est rien d'autre que la probabilité pour le point aléatoire de se trou- 
ver à l'extérieur de l'intervalle AB ; donc on a: 


D, >aP(|X—m;.|>a), 


ce qui démontre immédiatement l'inégalité en question. 

2. Dans le cas où X est continue, la démonstration est analogue 
à condition de remplacer les p, par des éléments de probabilité, et 
les sommes finies par des intégrales. En effet : 


P(IX—-m|>a)= |  f()dr*), (13.2.7) 
[x-mMx Da 
où f (x) est la densité de probabilité de X. Ensuite 
D,= | (z—m.)" f (x) dr = 


= [lz-mP(ds> | I—mrl(ads, 
— 00 Ix-mxl>a 


où |r—m,|>> a au-dessous de l'intégrale signifie que l’intégra- 
tion s'étend à toute la partie extérieure de l'intervalle AB. 

En remplaçant | x — m, | sous le signe de l'intégrale par « 
on obtient: 


De>at | f(2)dz=0@P(IX—m.|>a), 
| x—Mx [>œ 
d’où on déduit l'inégalité de Tchébychev pour les variables continues. 
Exemple. Soit X une variable aléatoire d'espérance mathé- 
matique m. et de variance 0%. Trouver l'estimation majorante de 
la probabilité pour X de s'écarter de son espérance mathématique 
d’une grandeur au moins égale à 30. 


est remplacé par le signe = car pour une variable continue 
la Dr bebiliéé d'une égalité exacte est nulle. 
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Solution. En posant &« = 30, dans l'inégalité de Tchéby- 
chev on a: 
P(|X 30) <= = + 
(| —m:|> GO) Gr — 9? 
c'est-à-dire la probabilité pour qu'une variable aléatoire s'écarte de 
son espérance mathématique d'une grandeur dépassant trois fois l’é- 
cart quadratique moyen, ne peut être supérieure à 1/9. 

Not a. L’inégalité de Tchébychev ne donne que la limite supé- 
rieure de la probabilité de l'écart en question. Aucune loi de réparti- 
tion ne peut donner une probabilité supérieure à cette valeur limite. 
En pratique dans la majorité des cas la probabilité pour que la va- 
riable X sorte des limites de l'intervalle m, + 30, est nettement 
inférieure à 1/9. Par exemple, pour la loi normale cette probabilité 
est voisine de 0,003. En pratique, le plus souvent on a affaire à des 
variables aléatoires dont les valeurs sortent très rarement au-delà 
de m, + 30.. Si l’on ne connaît pas la loi de répartition d’une gran- 
deur aléatoire, mais seulement m,. et o., on considère que l'intervalle 
m; + 30, est le domaine des valeurs possibles de la grandeur aléa- 
toire (règle dite « des trois sigma »). 


13.3. Loi des grands nombres (théorème de Tchébychev) 


Dans ce paragraphe nous allons démontrer un théorème des plus 
simples mais à la fois des plus importants de la loi des grands nom- 
bres, à savoir le théorème de Tchébychev. Ce théorème établit une rela- 
tion entre la moyenne arithmétique des valeurs observées d’une 
variable aléatoire et son espérance mathématique. 

Préalablement nous allons résoudre le problème auxiliaire suivant. 

Soit À une variable aléatoire d'espérance mathématique m,. 
et de variance D. Les nr expériences indépendantes fournissent les 
valeurs observées de X dont on calcule la moyenne arithmétique. 
[1 y a lieu de trouver les caractéristiques numériques de cette moyenne 
arithmétique, donc, son espérance mathématique et sa variance, et 
d'estimer leur variation avec augmentation de n. 

Introduisons les désignations suivantes : 

X 1, valeur de X dans la première expérience ; 

X2, valeur de X dans la seconde expérience, etc. 

Il est évident que l’ensemble des valeurs X:, X2, ..., X, repré- 
sente z variables aléatoires indépendantes réparties chacune suivant 
la même loi que la grandeur X. Soit la moyenne arithmétique de ces 
variables : 


280 THÉORÈMES LIMITES DE LA THÉORIE DES PROBABILITÉS [CH. 13 


La variable aléatoire Ÿ est une fonction linéaire des variables 
aléatoires indépendantes X1, X2, ..., X\. Calculons l'espérance 
mathématique et la variance de Ÿ. En vertu des règles formulées 
dans le $ 10 pour les caractéristiques numériques des fonctions linéai- 
res on a: 


n 
my=M|Y|=< 5 M\Xi|=<nm=m;; 


i= 1 


n 
Dy=+ DDXI= ZE. 
fu 1 

Ainsi, l'espérance mathématique de Ÿ ne dépend pas du nombre 
d'expériences n et est égale à l'espérance mathématique de la variable 
observée X ; pour ce qui est de la variance de Y, elle décroît indéfini- 
ment au fur et à mesure de l’augmentation du nombre d'expériences 
et peut être aussi petite que l’on veut lorsque n est suffisamment grand. 
On voit ainsi que la moyenne arithmétique est une variable aléatoire 
de variance aussi petite que l’on veut et pour un nombre d’expérien- 
ces suffisamment grand elle se conduit à peu près comme une grandeur 
non aléatoire. 

Le théorème de Tchébychev établit sous une forme qualitative 
exacte cette stabilité de la moyenne arithmétique. Ce théorème 
se formule comme suit : 

Pour un nombre d'expériences indépendantes suffisamment grand, 
la moyenne arithmétique des valeurs observées d'une variable aléatoire 
converge en probabilité vers son espérance mathématique. 

Nous allons écrire le théorème de Tchébychev sous la forme d'une 
formule. Rappelons-nous le sens de l'expression « convergence en 
probabilité ». On dit qu’une variable aléatoire X, converge en pro- 
babilité vers a si lorsque r augmente, la probabilité pour que X, 
et a soient aussi voisins que l’on veut tend indéfiniment vers l'unité, 
ce qui signifie que pour » suffisamment grand on a: 


P(IXn—al<e)>1—6, 


où €, Ô sont des nombres infiniment petits arbitraires. 
Ecrivons le théorème de Tchébychev sous une forme analogue. 


Selon ce théorème lorsque nr augmente la moyenne arithmétique 
n 


DET 


= converge en probabilité vers m,, c'est-à-dire: 
ñn 
> Xi 


Nous allons démontrer cette inégalité. 


13.4] THÉORÊME DE TCHEBYCHEV GENÉRALISÉ. THÉORÊME DE MARKOV 281 


Démonstration. Nous avons démontré plus haut que la 
grandeur 


n 
2 Xi: 
Y — {mi 
a pour caractéristiques numériques 
Ds 


My = Max): Dy=—<e 


Appliquons à la grandeur Ÿ l'inégalité de Tchébychev en posant 
a =: 


D D 
P(IY—-mI>e)<-i=<. 


Quelque petit que soit e, on peut toujours trouver un n suffisam. 
ment grand pour que l'inégalité 


soit remplie, Ô étant un nombre aussi petit que l’on veut. 


On a alors: 
Pl ds 


d'où, en passant à l'événement contraire, on a1 


1 


ce qu'il fallait démontrer. 


n 
D x 
ii _ Ms 


n 
N 
2 Xi 
{= 1 
n 


—Mx . 1 — 6. 


13.4. Théorème de Tchébychev généralisé. 
Théorème de Markov 


On peut facilement généraliser le théorème de Tchébychev au 
cas plus compliqué où la loi de répartition de la variable aléatoire X 
change d’une expérience à l'autre. Dans ce cas, au lieu de la moyenne 
arithmétique des valeurs observées d’une même grandeur X d’espé- 
rance mathématique et de variance constantes, nous avons affaire à 
la moyenne arithmétique de nr variables aléatoires différentes, d’espé- 
.ances mathématiques et de variances différentes. Il se trouve que 
même dans ce cas, sous certaines réserves, la moyenne arithmétique 
est stable et converge en probabilité vers une certaine grandeur non 
aléatoire. 
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Le théorème de Tchébychev généralisé peut se formuler comme 
suit. Si 
Xu, X>, e © 7 X, 


sont des variables aléatoires indépendantes d'espérances mathématiques 
Mrs Mg: 1 Men 


D,,, Das ..: De 
et si toutes Les variances ont même limite supérieure L : 
D;,<L (= 1, 2. ...) n), 
lorsque n augmente la moyenne arithmétique des valeurs observées des 
variables X;, X2, ..., X, converge en probabilité vers la moyenne 
arithmétique de leurs espérances mathématiques *). 
Nous allons écrire ce théorème sous la forme d’une formule. Soient 


e, Ô des nombres positifs aussi petits que l’on veut. Pour n suffisam- 
ment grand on aura alors: 


n 
> à n 
P\| =. = <e]=>1—6. (13.4.1) 
Démonstration. Considérons la grandeur: 

n 

2 Xi 

is 
Fe 


Son espérance mathématique est : 


et de variances 


et sa variance: 


Dy= D D, 
Appliquons à Ÿ l'inégalité de Tébébycher, soit : 
P(IY—m,|>e) <<, 
ou 
D D, 


> ) < es (13.4.2) 


imi i=1 


(2 DES 


*) C'est-à-dire que la différence entre les deux moyennes arithmétiques 
converge en probabilité vers zéro. 


13.4] THÉORÊME DE TCHÉBYCHEV GÉNÉRALISÉ. THÉORÊME DE MARKOV 283 


Remplaçons dans le second membre de (13.4.2) chacune des gran- 
deurs D., par la grandeur ZL qui lui est supérieure. Ceci ne fera que 


renforcer l'inégalité : 


À 


Quelque petit que soit e on peut toujours trouver un n suffisam- 
ment grand pour que l'inégalité suivante soit remplie 


L LS. 
re <5; 


nr n 
( > Xi > M, 
L {mi _… {mi 
n 


n 


n n 
> X: > mx, 
ii _ 1=i 


on a alors: 


ee 


d’où, en passant à l’événement contraire, on obtient l'inégalité à 
démontrer (13.4.1). 

On peut généraliser la loi des grands nombres au cas des variables 
aléatoires dépendantes. On doit cette généralisation à A. Markov. 


Théorème de Markov. Soient X,, X2, ..., X, des 
variables aléatoires dépendantes. Si pour n —+ œ on a: 
D[2 Xi] 
—=— —0, 


la moyenne arithmétique des valeurs observées des variables aléatoires 
À 4, X2, - +, À A converge en probabilité vers la moyenne arithmétique 
de leurs espérances mathématiques. 


Démonstration. Considérons la grandeur: 


Il est évident que l'on a: 


DEN 
D,=—È— 


Appliquons à Ÿ l'inégalité de Tchébychev : 
P(IY-mI>0< 2. 


2 
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Comme en vertu de ce théorème pour ñ —> oo on a D, +0, pour n 
suffisamment grand: 


P(IY—-m,123 e) <6, 


ou, en passant à l'événement contraire: 


Ÿ Xi Ÿ Mes 


{mi {1 
PQ come (|A - À 


ce qu'il fallait démontrer. 


13.5. Conséquences de la loi des grands nombres : 
théorèmes de Bernoulli et de Poisson 


Le théorème bien connu de J. Bernoulli établissant une relation 
entre la fréquence d’un événement et sa probabilité peut être démon- 
tré comme une conséquence immédiate de la loi des grands nombres. 

Supposons que l’on effectue n expériences indépendantes, dans 
chacune desquelles l’événement À peut apparaître ou ne pas appa- 
raître, avec une probabilité p. En vertu du théorème de J. Bernoulli, 
lorsque le nombre d'expériences n augmente indéfiniment, la fréquence 
de l'événement À converge en probabilité vers sa probabilité p. 

Désignons par P* la fréquence de l’événement À dans nr expé- 
riences, le théorème de J. Bernoulli peut alors s’écrire comme suit : 


P(IP*—pl <e)>1—6, (43.5.1) 


où e, Ô sont des nombres positifs aussi petits que l’on veut. 
Il y a lieu de démontrer cette formule pour un n suffisamment 
grand. 


Démonstration. Considérons les variables aléatoires 
indépendantes : X,, nombre d’apparitions de l'événement À dans la 
première expérience; X:, nombre d'apparitions de l'événement À 
dans la seconde expérience, etc. 

Toutes ces variables sont discontinues et ont même loi de réparti- 
tion s'exprimant par le tableau de la forme: 


o | 
1 


avec q — 1 — p. L'espérance mathématique de chacune des variables 
X, est égale à p, et sa variance à pq (voir $ 10.3). 
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La fréquence P* n’est rien d'autre que la moyenne arithmétique 
des variables X,, X:, ..., X 


et en vertu de la loi des grands nombres converge en probabilité 
vers l’espérance mathématique commune à ces variables aléatoires, 
d’où l'inégalité (13.5.1). 

En vertu du théorème de Bernoulli pour des conditions d'expé- 
riences constantes la fréquence est stable. Cette stabilité se manifeste 
également lorsque les conditions d’expériences sont variables. Le 
théorème établissant la stabilité des fréquences pour des conditions 
d'expériences variables est appelé théorème de Poisson et se formule 
comme suit : 

Si l'on effectue. n expériences indépendantes et que la probabilité 
d'apparition de l'événement À dans l' i-ème expérience est égale à p:, 
avec augmentation de n, la fréquence de l'événement À converge en pro- 
babilité vers la moyenne arithmétique des p 

Le théorème de Poisson peut être déduit du théorème généralisé 
de Tchébychev tout comme le théorème de Bernoulli a été déduit à 
partir de la loi des grands nombres. 

Le théorème de Poisson joue un très grand rôle dans les applica- 
tions pratiques de la théorie des probabilités. En effet, les méthodes 
probabilistes sont utilisées pour l'étude des effets qui ont peu de chan- 
ces de se répéter dans les mêmes conditions un grand nombre de fois, 
mais se répètent maintes fois dans des conditions très différentes, la 
probabilité des événements nous intéressant dépendant fortement 
de ces conditions. Par exemple, la probabilité d'atteindre un objectif 
dépend beaucoup de la distance de l'objectif, de raccourci de l’objec- 
tif, de l’altitude et de la vitesse de l’avion et de l'objectif, etc. Les 
facteurs déterminant les conditions du combat aérien sont trop nom- 
breux pour qu’on puisse s’attendre à la répétition des mêmes condi- 
tions. Néanmoins, on peut noter une stabilité de la fréquence d’at- 
teindre un but dans des expériences réelles pour des conditions très 
variables, cette fréquence tend vers la probabilité moyenne d'atteindre 
un but caractéristique pour un groupe donné de conditions. C'est 
pourquoi les méthodes d'organisation de tirs, basées sur la probabilité 
maximale d'atteindre le but, seront ici justifiées, bien que les expé- 
riences ne soient pas nombreuse pour un ensemble donné de condi- 
tions. 

La situation est analogue quand il s’agit de vérifier expérimen- 
talement les calculs probabilistes. Souvent il y a lieu de vérifier, que 
la probabilité calculée d’un événement quelconque À correspond à 
sa fréquence donnée. Le plus souvent il s’agit de vérifier un schéma 
théorique se trouvant à la base d’une méthode de calcul de la proba- 
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bilité d’un événement. Lors d'une telle vérification on n'arrive pas 
toujours à reproduire les mêmes conditions d'expériences un nombre 
suffisant de fois. Néanmoins on peut réaliser cette vérification si 
l’on compare la fréquence observée non pas avec la probabilité pour 
des conditions fixées mais avec la moyenne arithmétique des probabi- 
lités calculées pour des conditions différentes. 


13.6. Les phénomènes aléatoires de masse 
et le théorème central limite 


Dans les paragraphes précédents nous avons étudié différentes 
formes de la loi des grands nombres, affirmant toutes la même chose, 
à savoir la convergence en probalilité des variables aléatoires vers 
des grandeurs constantes. Dans aucune forme de la loi des grands 
nombres nous n’avons envisagé les lois de répartition des variables 
aléatoires. Les lois de répartition limites sont objet d’un autre groupe 
de théorèmes, appelé theorème central limite, parfois considéré comme 
forme quantitative de la loi des grands nombres. 

Toutes les formes du théorème central limite établissent les condi- 
tions pour lesquelles une loi normale peut apparaître. Comme ces 
conditions sont assez souvent réalisées dans la pratique, la loi normale 
se trouve être la plus répandue des lois de répartition, surtout dans 
les phénomènes aléatoires de la nature. Elle apparaît chaque fois que 
la grandeur aléatoire observée peut être présentée comme la somme 
d’un nombre suffisamment grand de composantes élémentaires indé- 
pendantes (ou faiblement lices), dont chacune influe peu sur la somine. 

Dans la théorie du tir la loi de répartition normale joue un rôle 
particulièrement important, car dans la plupart des cas pratiques 
les coordonnées des points d'atteinte et des points d’éclatement des 
obus sont normalement réparties. Ceci peut s'expliquer sur l’exemple 
suivant. 

Supposons qu’on tire sur une cible plane dont le centre (point 
de visée) est pris pour origine des coordonnées. Le point d'atteinte 
peut être caractérisé par deux variables aléatoires X et Y. Considé- 
rons l’une d'elles, par exemple l’écart X entre le point d'atteinte et le 
but suivant l’axe Oz. Cet écart est dû à l’action conjointe d’un grand 
nombre de facteurs relativement peu importants, comme, par exemple, 
l’erreur de pointage, l'erreur de détermination de la distance à la 
cible, les vibrations de la pièce lors du tir, les erreurs de fabrication 
de l’obus, les conditions atmosphériques, etc. Chacun de ces facteurs 
produit une erreur X;, dite élémentaire, dont la somme donne la coor- 
donnée X du point d'atteinte: 


X = Xi+Â2+...+ À: +... (13.6.1) 


Comme ces facteurs sont très nombreux, ils ne dépendent presque pas 
les uns des autres et l'influence de chacun sur la somme est petite et 
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à peu près la même, les conditions d’applicabilité du théorème 
central limite se trouvent ainsi réalisées et la grandeur (13.6.1) doit 
obéir à une loi de répartition voisine de la loi normale. 

Voyons un peu plus en détail l’assertion sur l'influence petite et 
à peu près égale de chacun des termes sur la somme. Le sens en est que 
parmi les erreurs élémentaires de tir aucune ne prévaut sur la somme 
de toutes les autres. En effet, si une erreur prédominait, il y a lieu 
de penser qu’en établissant les lois de tir ou en construisant un appa- 
reil de visée, on essayerait de l'éviter en tenant compte de la plus 
importante des causes écartant l’obus du but. Les facteurs aléatoires 
négligés donnant lieu à une dispersion sont généralement très petits 
et aucun d’eux ne prédomine. C’est pourquoi on adopte générale- 
ment la loi normale pour la répartition des points d'impact des 
obus *). 

La loi de répartition normale prédomine non seulement dans la 
théorie du tir mais également dans de nombreux autres domaines, 
par exemple dans la théorie des mesures. C’est en se basant sur la 
théorie des mesures que Laplace et Gauss ont formulé la loi normale. 
En effet, dans la majorité des cas les erreurs apparaissant lors de la 
mesure de telle ou telle grandeur physique obéissent à la loi normale ; 
la raison en est que ces erreurs sont généralement la somme d’un 
grand nombre d'erreurs élémentaires indépendantes dues à des 
causes différentes. Longtemps la loi normale était considérée comme 
loi unique et universelle des erreurs. Ce n’est pas vrai, car l’expérience 
montre que dans certains processus de mesure et de fabrication on 
rencontre des lois de répartition différant de la loi normale, néan- 
moins celle-ci reste la plus répandue et la plus importante pour les 
applications pratiques des lois de mesure. 


13.7. Fonctions caractéristiques 


Dans sa forme générale le théorème central limite a été démontré 
par À. Liapounov en 1900. Pour démontrer ce théorème A. Liapounov 
a élaboré une méthode spéciale dite des fonctions caractéristiques. 
Par la suite cette méthode a acquis une importance par elle-même, 
s'étant avérée puissante et souple. 

On appelle fonction caractéristique de la variable aléatoire X 
la fonction 


g(t) = M [ex], (13.7.1) 


*) Dans certains cas la répartition réelle des points d'impact dans le plan 
peut différer notablement de la loi normale, Fe exemple lors du tir dans des 
conditions très variables, lorsque le centre de dispersion et l'écart probable 
lors du tir changent notablement. Cependant nous avons alors affaire non pas 
à la loi de répartition des coordonnées du point d'impact pour un coup, mais 
à la moyenne de ces lois pour des coups différents. 
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où à est l'unité imaginaire. La fonction g (f) est l'espérance mathé- 
matique d'une certaine variable aléatoire complexe 


U —=eitx, 


fonctionnellement liée à X. Pour la solution de nombreux problèmes 
de la théorie des probabilités il est plus commode d'utiliser les fonc- 
tions caractéristiques et non pas les lois de répartition. 
Connaissant la loi de répartition de X il est facile de trouver sa 
fonction caractéristique. 
Si X est une variable aléatoire discrète répartie suivant le tableau : 


sa fonction caractéristique est : 


g(t)=— 2 Rp. (13.7.2) 


Si X est une variable aléatoire continue de densité de probabilité 
f (x), sa fonction caractéristique est : 


g()= | e*f (x) de. (13.7.3) 


Exemple 1. La variable aléatoire X est le nombre d'impacts lors 
d’un coup. La probabilité d'atteindre le but est égale à p. Trouver la fonction 
caractéristique de X. 

Solution. En vertu de la formule (15.7.2) on a: 


g(t)=e"t"° (1—p)+eft" tp—g+ettp 
où g = 1 — 


| Exem 5 le 2. La variable aléatoire X est répartie suivant la loi nor- 
male: 


f (z)= Æ 2. Fe (13.7.4) 


Trouver sa fonction caractéristique. 
Solution. En vertu de la formule (13.7.3) on a: 


co x? œ æ3 


ses ils 
g(t)= | eitx — e * dr=— Le | e dz. (13.7.5) 
d V/2x V'27 J 
En utilisant la formule bien connue 
oo _ AC—BH° 
| p—Ax+2Bx—C 7, — Z e À 
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et compte tenu de ce que i? = —1 on a: 
t2 
g(t)—e ?. (13.7.6) 
La formule (13.7.3) donne la fonction caractéristique g (t) d'une 
variable aléatoire continue X en fonction de sa densité de probabilité 
f (x). La transformation (13.7.3) permettant de trouver g (£) à partir 
de f (x) porte le nom de transformation de Fourier. Dans les cours d’ana- 
lyse mathématique on montre que si la fonction g ({t) s'exprime en 
fonction de f (x) à l’aide d’une transformation de Fourier, inverse- 
ment, la fonction f (x) s'exprime en fonction de g (t) à l’aide de la 
transformation de Fourier inverse : 


fo=r [e“zeuae). (43.7.7) 


Nous alions formuler et démontrer les propriétés essentielles des 
fonctions caractéristiques. 
1. Si deux variables aléatoires X et Y sont liées par la relation 


Y = aX, 


où a est un facteur non aléatoire, leurs fonctions caractéristiques sont 
liées par la relation 


Eu (t) = 8x (ai). (13.7.8) 
Démonstration. 
&y(t)=M{et*] = M [eitaX] = M [eitenX] — g, (at). 


2. La fonction caractéristique d'une somme de variables aléatoires 
indépendantes est égale au produit des fonctions caractéristiques des 
composantes. 


Démonstration. Soient X,, X2, ..., À, des variables 
aléatoires indépendantes de fonctions caractéristiques 


Bxa (E); Bxa (E), +, Bxn(t) 
et leur somme: 


Il y a lieu de montrer que: 
8 E)= NN 8, (4)- (13.7.9) 


*) Aux 86 17.3 et 17.4 on verra les mêmes transformations de Fourier 
mais reliant la fonction de corrélation et la densité spectrale. 


19—2823 
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On a: 


S 
gy(t)= M {eit*] =M PE EE me M RL il ea]. 
Les variables X, étant indépendantes, leurs fonctions e sl, sont 


également indépendantes. En vertu du théorème du produit des espé- 
rances mathématiques on a: 


e(t)= I Mile" x]= I gs, (6), 
R=1 R=1 


ce qu'il fallait démontrer. 

L'appareil des fonctions caractéristiques est souvent utilisé pour 
la composition des lois de répartition. Soient par exemple deux varia- 
bles aléatoires indépendantes X et Y de densités de probabilité 
f1 (x) et f2 (y). Il y a lieu de trouver la densité de probabilité de la va- 


riable 
Z=X<+Y. 


A cet effet on peut procéder comme suit : on trouve les fonctions carac- 
téristiques g. (t) et g, (t) des variables aléatoires X et Ÿ, on forme 
leur produit et on obtient ainsi la fonction caractéristique de la 


grandeur Z: 
82 (4) = 8x (1) Ey (2), 


puis en faisant subir à g, (t) une transformation de Fourier inverse 
on trouve la densité de probabilité de Z: 


Ro=Z | o%e (0 dt. 


Exemple 3. Trouver à. l’aide des fonctions caractéristiques la compo- 
sition de deux lois normales: 
f. (z) de caractéristiques m, = 0; ©. ; 
f (zx) de caractéristiques my = 0; oy. 
Solution. Cherchons la fonction caractéristique de X. A cet effet 


écrivons: 
X — OxU, 


où Mu — 0: 
En utilisant “le résultat de l'exemple 2 on trouve: 
{13 
Eu (t)=e 2. 
En vertu de la propriété 1 des fonctions caractéristiques on a: 
(o,t)2 
7 2 


Ex (1) = Eu (0x!) —=e 
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et d’une manière analogue: 
(oyt)? 
ey()=e À 
En multipliant g, (t) par gy (t) on a: 
3 2 
_CtD, 
&z (t)=e ( 
c’est la fonction caractéristique d'une loi normale de paramètres m, = 0; 


0, = Vo:t+0,?. On a ainsi obtenu la composition des lois normales d’une 
manière bien plus simple que dans le & 12. 


13.8. Théorème central limite pour 
des composantes de même loi de répartition 


Les différentes formes du théorème central limite diffèrent les 
unes des autres par les conditions imposées à la répartition des com- 
posantes aléatoires. Nous allons formuler et démontrer ici le théorème 


central limite pour le cas le plus simple où les termes sont de même 
loi de répartition. 


Théorème. Soient X,, X2, ..., X, des variables aléatoires 
indépendantes de même loi de répartition, d'espérance mathématique m 


et de variance 0” ; lorsque n augmente indéfiniment la loi de répartition 
de la somme 


n 
Y:= D X, (13.8.1) 
Rh=1 
tend vers la loi normale. 


Démonstration. Nous allons donner la démonstration 
pour le cas des variables aléatoires continues X,, ..., X, (dans le 
cas discret la démonstration est analogue). 

En vertu de la seconde propriété des fonctions caractéristiques 
démontrée dans le paragraphe précédent, la fonction caractéristique 
de Ÿ, est égale au produit des fonctions caractéristiques des compo- 
santes. Les variables aléatoires X:, . .., À, ont même loi de répar- 
tition de densité f (x) et par conséquent même fonction caractéristique 


g=(t)= | e'*f(x)dz. (13.8.2) 
La fonction caractéristique de Ÿ, sera : 
&v, (t)= [ex (t)]". (13.8.3) 


Nous allons étudier plus en détail la fonction g. (#). A cet effet écri- 
vons-la au voisinage du point £ — 0 comme une série de Maclaurin, 


19° 
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en nous bornant aux trois termes : 


en = ge (0)+e0)+[-E+a(t)]r, (43.84 


où æ& (t) > 0 pour f{ —+ 0. 
Calculons les grandeurs g, (0), g; (0), gx (0). En posant t = 0 
dans la formule (13.8.2) on a: 


8x (0) — | f(x) dz = 1. (13.8.5) 


Dérivons (13.8.2) par rapport à t: 


gz(t)= | ire “*f(z)dr=i | rel*f (x) dr. (13.8.6) 


En posant t — O dans (13.8.6) on obtient: 


8x (0) = à | zf(z)dr=iM[X]=im. (13.8.7) 


I1 est évident qu'on ne restreint pas la généralité en posant m = 0 
(il suffit pour cela de transférer l'origine au point m). On a alors: 


gx (0) —0. 


En dérivant (13.8.6) une deuxième fois on a: 


gz(t)= — | r'elt*f (x) dx, 
d'où n 
gx (0) = — | 2tf(x)dz. (13.8.8) 


Pour m = 0 l'intégrale dans l'expression (13.8.8) n’est rien d'autre 
que la variance de X de densité f (x), par conséquent : 


gx (0) = — 01. (13.8.9) 

En substituant g, (0) = 1, g; (0) = 0 et g; (0) = —0* dans (13.8.4) 
on obtient : 

g=(=1—[S-0(4]e. (3.8.0) 


Considérons la variable Y,. Nous voulons démontrer que sa loi 
de répartition lorsque 7 augmente tend vers la loi normale. Pour cela 
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. passons de Ÿ, à la variable aléatoire normée 


Yn 

Zh = Ve (13.8.11) 
très commode, car sa variance ne dépend pas de r et est égale à l'unité 
quel que soit nr. Il est facile de s’en rendre compte en considérant Z, 
comme une fonction linéaire des variables aléatoires indépendantes 
X:, X2, ..., X, de même variance 0°. Si l’on montre que la loi de 
répartition de Z, tend vers la loi normale, il est évident qu'il en sera 
de même pour Y,, liée à Z, par la relation linéaire (13.8.11). 

Au lieu de démontrer la convergence de la loi de Z,,, avec augmen- 
tation de n, vers la loi normale, nous allons démontrer que sa fonc- 
tion caractéristique tend vers la fonction caractéristique de la loi 
normale *). 

Cherchons la fonction caractéristique de Z,. En vertu de la pre- 
mière propriété (13.7.8) des fonctions caractéristiques on obtient à 
partir de la relation (13.8.11): 


85. (t)= Eu, (7) , (13.8.12) 


où g,, (t) est la fonction caractéristique de Y,. 
.Les formules (13.8.12) et (13.8.3) donnent : 


8 (= [ex ( =) (43.8.13) 


ou, en utilisant la formule (13.8.10): 


2 t + 12 Vn 
&z, (£) = {1 (Se (7) 02 } . (13.8.14) 
Prenons le logarithme de l'expression sn 8. ge | 


In g:, ({)=nin {1 — Se (—— = ee TE 7} 
Introduisons la désignation: 
o2 t 2 
[Se ve) Jo =*. (13.8.15) 
On a alors: 
Ing, (t)=nlin{i—x}. (13.8.16) 


Faisons tendre nr vers l'infini. En vertu de (13.8.15) ceci fait 
tendre x vers zéro. Lorsque n est important, cette grandeur est assez 
petite. Développons In {1 — x} en série et limitons-nous au premier 
terme du développement (pour nr —+ œ les autres termes seront négli- 


*) Nous adoptons ici sans démonstration que la convergence des fonctions 
caractéristiques entraîne la convergence en lois. 
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geables) : 
In f{—x})Z= — x. 
On aura alors: 


lim Ing; (= limn. (—x)= 


= lim taf) z}=-5+limie(— ). 


fo fo 


Par définition la fonction « (t) tend vers zéro pour t —+ 0; par consé- 
quent : 


lim a ( : ) =0 


ñn—00 C0 n 
et : 
E t 
on ON 
d'où 
RL 
lim g, (t)=e ?. (13.8.17) 
no 


Ce n’est rien d’autre que la fonction caractéristique de la loi normale 
de paramètres m — 0, o = 1 (voir exemple 2 du $ 13.7). 

Ainsi on a démontré que lorsque x augmente la fonction caracté- 
ristique de la variable aléatoire Z, tend indéfiniment vers la fonction 
caractéristique de la loi normale; on en conclut que la loi de Z, 
(donc également de Ÿ,) converge vers la loi normale, ce qu'il fallait 
prouver. 

Nous avons ainsi démontré le théorème central limite pour Île 
cas particulier, mais fort important, de composantes de même répar- 
tition. Cependant ce théorème est également vrai, sans restrictions 
importantes, pour des composantes à répartition différente. À. Liapou- 
nov a démontré le théorème central limite pour les conditions sui- 
vantes : 


lim —4=1  _—0, (13.8.18) 


où b, est le troisième moment central absolu de X, : 


b = vslXl= MIX, Pl (&—1,...,n) 


et D,, la variance de X,. 
La condition la plus générale (nécessaire et suffisante) pour que 
le théorème central limite soit vrai est la condition de Lindeberg : pour 
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+ > O0 quelconque 
; 1 - 
lim B:= >» | (z— m3)" fr (x) dr =0, 


FTP hoifx-m)i>tB, 


où m, est l'espérance mathématique, f, (zx) la densité de probabilité 


n 
de la grandeur aléatoire X, et B, = V 52, 
h=i 


13.9. Formules pratiques exprimant le théorème 
central limite 


En vertu du théorème central limite, la loi de répartition d'une 
somme d’un nombre suffisamment grand de variables aléatoires indé- 
pendantes (pour des restrictions assez faibles) converge vers la loi 
normale. On peut utiliser le théorème central limite même lorsqu'on 
a affaire à une somme d’un nombre relativement peu important de 
variables aléatoires. Lorsque l’on prend la somme de variables aléa- 
toires indépendantes, de dispersion voisine, au fur et à mesure de 
l'augmentation du nombre des composantes la loi de répartition de 
la somme converge rapidement vers la loi normale. Dans la pratique 
on remplace souvent une loi de répartition par une autre; pour une 
précision assez faible des calculs probabilistes, cette substitution peul 
également étre très approchée. L'expérience montre, que pour une 
dizaine de composantes (parfois même moins) la loi de répartition de 
la somine peut être remplacée par la loi normale. 

On utilise souvent le théorème central limite pour calculer la pro- 
babilité pour la somme de plusieurs variables aléatoires de se trouver 
dans certaines limites. 

Soient À1,, X2, ..., À, des variables aléatoires indépendantes 
d'espérances mathématiques 


Mi, Mo, ces Mn 
et de variances 
D:, D>;, 7 D;. 


Supposons que Îes conditions du théorème central limite soient 
remplies: les variables X;,, X2, ..., À, produisent les effets com- 
parables sur la dispersion de la somme et le nombre de termes nr 
est suffisant pour que la loi de répartition de la somme 


Y=Ÿx, (13.9.1) 


ii 


puisse ctre considérée normale. 
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La probabilité pour la variable aléatoire Y de se trouver dans 
l'intervalle (x, B) s'exprime par la formule: 
_ B—my a— my 
P(Aa<Y<p=o (Eu) ot (EE), (439.2 
où m,, OC Sont l'espérance mathématique et l'écart quadratique 
moyen de Ÿ ; ®* la fonction de répartition normale. 


En vertu du théorème d’addition des espérances mathématiques 
et des variances on a: 


n 


Oy = V D, -V So. 


Ainsi pour trouver approximativement la probabilité pour la 
somme d'un grand nombre de variables aléatoires de se trouver à 
l'intérieur d’un certain intervalle, il n'est pas nécessaire de connaître 
la loi de répartition de ces variables mais seulement leurs caracté- 
ristiques. Il est évident que ceci n’est vrai que si se trouve remplie 
la condition essentielle du théorème central limite, à savoir que cha- 
que terme exerce une influence petite et du même ordre de grandeur 
sur la dispersion de la somme. 

En plus des formules du type (13.9.2), dans les applications pra- 
tiques on utilise des formules dans lesquelles la somme des X, est 
remplacée par leur somme normée, soit: 


(13.9.3) 


$ pà Xi 2 mi 
Z = y = — —©— . (13.9.4) 
Vi D; 
is 1 


Il est évident que l'on a: 
MIZ1=0; DIZ] = o, = 1. 


Si la loi de répartition de Ÿ est voisine de la loi normale de para- 
mètres (13.9.3), celle de Z est voisine d’une loi normale de paramèe- 
tres m;: —=0, o, —1. D'où 


P(a<Z<$) = ®* (B) — D* (a). (13.9.5) 


Le théorème central limite peut être appliqué non seulement aux 
variables aléatoires continues, mais également aux variables alea- 
toires discrètes à condition d'opérer non pas avec les densités mais 
avec les fonctions de répartition. En effet, si les variables X,, X 2, . .. 
..., À, Sont discrètes, leur somme est également une variable aléa- 
toire discrète, et, en toute rigueur, ne peut suivre une loi normale. 


13.9] FORMULES PRATIQUES 2u7 


Néanmoins, toutes les formules du type (13.9.2), (13.9.5) restent 
vraies car elles contiennent non pas des densités mais des fonctions de 
répartition. On peut montrer que si les variables aléatoires discrètes 
satisfont au théorème central limite, la fonction de répartition de 
leur somme normée Z [voir la formule (13.9.4)] pour r —> œ converge 
vers une loi normale de paramètres m, — 0, ©, = 1 

Le théorème de Laplace est un cas particulier du théorème central 
limite pour des variables aléatoires discrètes. 

Si l’on effectue n expériences indépendantes, dans chacune desquel- 
les l'événement À apparaît avec une probabilité p on a la relation : 


P (a <= = —u — <B)= = D° (B)—D* (a), (13.9.6) 
où Ÿ est le nombre d' és de l'événement À dans n expérien- 
ces et q = 1 — p. 


Démonstration. Supposons que l’on effectue x expé- 
riences indépendantes dans chacune desquelles l'événement À peut 
apparaître avec une probabilité p. Ecrivons Ÿ, le nombre total d’ap- 
paritions de l'événement À dans n expériences, comme la somme : 


Y= ÿ X;, (13.9.7) 
{m1 


où À, est le nombre d’apparitions de l'événement À dans l’i-ème : 
expérience. 

En vertu du théorème démontré dans le 8 13.8, la loi de réparti- 
tion d'une somme de termes de même répartition tend vers la loi 
normale lorsque le nombre de termes augmente. Par conséquent, 
pour un n suffisamment grand on peut appliquer la formule (13.9.5) 
avec 


Y — 
AR ae 2 (13.9.8) 


Cy 
Dans le $ 10.3 nous avons démontré que l'espérance mathématique 
et la variance du nombre d’apparitions de l'événement dans nr expé- 
riences indépendantes sont : 
m, = np; D, = npg(g = 1 —p). 
En substituant ces expressions dans (13.9.8) on obtient: 


z—Y=nr_ 
Vars ” 


la formule (13.9.5) devient alors: 


P (a< = <B) = ®* (B)—D* (a). 


ce qui démontre le théorème énoncé. 
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Exemple 1. Supposons que 120 personnes fassent la queue à la caisse 
pour recevoir leurs paies, primes et assurances maladie. L espérance mathé- 
matique de la somme payée à une personne est égale à 50 francs. l’écart quadra- 
tique moyen est 30 francs. La caisse dispose de 6 500 francs. Trouver la proba- 
bilité pour que cette somme d'argent suffise pour payer les personnes de la 
queue. 

Solution. Considérons la variable aléatoire X. égale à la somme que 
doit payer la caisse. C’est une somme de nr — 120 variables aléatoires indépen- 
dantes; le nombre de termés est grand; en vertu du théorème central limite 
la loi de X est voisine d’une loi normale. Les caractéristiques de cette loi sont : 
mx = 120-50 = 6000, la variance D, — 120-303 — 108 000, l'écart quadrati- 
que moyen ©, — V/108 000 = 328. La probabilité pour que la somme dispo- 
nible soit suffisante pour payer tout le monde est: 


6500 — 6000 
328 


Exemple 2. Des appareils de deux types I et II, de même destina- 
tion sont en service. Un appareil du type I doit être réparé après exploitation 
avec la probabilité p1 — 0,2, et un appareil du type II avec la probabilité 
p2 = 0,4. Le nombre total d'appareils en service est r,; — 1000 du type I et 
n2 = 1500 du type Il. 1) Trouver la probabilité pour que le nombre d'appa- 
reils des deux types devant être réparés se trouve entre 750 et 850. 2) Trouver 
le nombre de réparations que doivent envisager les ateliers pour qu'avec une 
probabilité égale 0,99 le nombre d'appareils à réparer ne soit pas supérieur à NW. 

Solution. Lorsque le nombre d'expéricness est important (ici on 
a n; + n2 = 2 500) on peut considérer que le nombre X d’apparitions de l'évé- 
pement À — l’appareil doit être réparé — suit une loi normale. Les carac- 
téristiques de la variable aléatoire X sont: m, — 1000-0,2 + 1 500-0,4 — 
= 200 + 600 = 800; D, = 1000-0,2-0,8 + 1 500-0,4-0,6 — 520,  o, = 
— 520 = 22,8. 

1) P (750 < X < 850) = P (750 << X << 850) = P (| X — 800 | < 50) — 


50 
= * — sS PE Z 72. 


2) La valeur z, qui, avec une probabilité p — 0,99, ne sera pas dépassée 
par le nombre d'appareils envoyés en réparation, est donnée par la formule: 


zo — 800 
22,8 
Dans la table 1 de l’annexe an peut trouver la valeur de l’argument pour 
lequel la fonction D* est égale à 0,99: @* (2,33) = 0,99; d'où 7 _— 
= 2,33 et ro = 8543. 


P(X <6500) & P(X <6500) = | ) = 0,956. 


0,99=P (X ro) =©* 


CHAPITRE 14 


TRAITEMENT DES RÉSULTATS 
DES EXPÉRIENCES 


14.1. Particularités du traitement des résultats 
d'un nombre limité d'expériences. 
Estimations des paramètres inconnus 
d'une loi de répartition 

Dans le chapitre 7 nous avons déjà étudié certains problèmes 
de mathématiques statistiques relatifs au traitement des résultats 
des expériences. Il s'agissait essentiellement de trouver les lois de 
répartition de grandeurs aléatoires d'après les résultats des expérien- 
ces. Pour pouvoir déterminer la loi de répartition, il faut disposer de 
données statistiques suffisantes, plusieurs centaines au moins. Cepen- 
dant dans la pratique, on a affaire à un nombre de données statisti- 
ques bien plus réduit : deux ou trois dizaines d'observations, souvent 
même moins. Cet état de choses s’explique par le prix élevé et par la 
complexité des expériences. Des données aussi limitées sont nettc- 
ment insuffisantes pour trouver la loi de répartition inconnue d’une 
variable aléatoire; néanmoins ces données peuvent être traitées et 
utilisées pour obtenir certains renseignements sur la variable aléa- 
toire étudiée. Par exemple, on peut, à partir de données statistiques 
limitées, déterminer, ne serait-ce qu'approximativement, des carac- 
téristiques numériques importantes d’une variable aléatoire, à savoir 
l'espérance mathématique, la variance et parfois les moments d'ordre 
plus élevé. Dans la pratique on connaît souvent à l’avance la forme 
de la loi de répartition et il re reste qu’à déterminer certains paramè- 
tres de cette dernière. Si, par exemple, on sait qu'une variable aléa- 
toire est normale, le traitement se réduit à la détermination de deux 
paramètres de cette loi : m et os. Si l’on sait que la variable aléatoire 
étudiée est répartie suivant la loi de Poisson, un seul paramètre est 
à déterminer, à savoir l'espérance mathématique a. Enfin, dans cer- 
tains problèmes la forme de la loi de répartition importe peu, seules 
les caractéristiques numériques doivent être déterminées. 

Dans le présent chapitre nous allons étudier un certain nombre 
de problèmes où il y a lieu de déterminer les paramètres inconnus de 
la loi de répartition d’une variable aléatoire, ceci à partir d'un nombre 
limité de données. | 

Avant tout il faut noter que la valeur d’un paramètre inconnu, 
calculée à partir d'un nombre restreint de données, aura toujours un 
caractère aléatoire. ous appellerons estimation d'un paramètre cette 
valeur aléatoire approchée. Par exemple, l'estimation de l'espérance 
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mathématique peut être la moyenne arithmétique des valeurs obser- 
vées d’une variable aléatoire lors de rx expériences indépendantes. 
Lorsque le nombre d'expériences est très important, la moyenne arith- 
métique aura beaucoup de chances d’être très voisine de l'espérance 
mathématique. Si le nombre x d'expériences n’est pas grand, on intro- 
duit une certaine erreur en remplaçant l'espérance mathématique 
par la moyenne arithmétique. Cette erreur est en moyenne d'autant 
plus importante que le nombre d'expériences est petit. Il en sera de 
même pour les estimations d’autres paramètres inconnus. Toutes ces 
estimations sont aléatoires et des erreurs sont inévitables. Il est pré- 
férable de choisir l’estimation pour laquelle ces erreurs sont minima- 
les. 

Soit une variable aléatoire X dont la loi de répartition contient 
un paramètre inconnu a. Il s’agit, dans le cas général, de trouver une 
estimation convenable pour le paramètre a d’après les résultats de 
n expériences indépendantes, dans chacune desquelles la variable X 
a pris une valeur déterminée. 

Désignons les valeurs observées de X par 


X: Ai 2 7%: (14.1.1) 


Celles-ci peuvent être considérées comme n» échantillons de la varia- 
ble aléatoire X, c’est-à-dire nr variables aléatoires indépendantes, 
réparties chacune suivant la même loi que X. 

Désignons par a& l’estimation du paramètre a. Toute estimation 
calculée à partir de (14.1.1) doit être une fonction des variables X;, 
X, s + 4 An: 


a—a(X,, X2, -.., Xn) (44.1.2) 


et par conséquent être elle-même une variable aléatoire. La loi de 
répartition de a dépend de celle de X (et, en particulier, du paramè- 
tre inconnu a) ainsi que du nombre d'expériences #. En principe, les 
méthodes de la théorie des probabilités permettent de trouver cette 
loi de répartition. 


Imposons à l'estimation à des exigences, auxquelles elle doit 
satisfaire pour être considérée « bonne » en certain sens. 

Il est tout naturel d'exiger que l'estimation a tende (converge en 
probabilité) vers le paramètre a lorsque le nombre d'expériences 
augmente. Une estimation douée de cette propriété est dite consistante. 

Ensuite, il est désirable qu'en utilisant a au lieu de a, on ne com- 
mette pas au moins d'erreur systématique augmentant ou diminuant 
l'estimation obtenue c’est-à-dire que l’on ait: 


M la] = a. (44.1.3) 


Une estimation satisfaisant à cette condition est dite non biaisée. 
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Il est enfin désirable que l'estimation centrée choisie possède la 
variance minimale, c'est-à-dire 


D [al = min. (14.1.4) 


Une estimation douée de cette propriété est dite effective. 

Souvent il est difficile de satisfaire à toutes ces conditions. Par 
exemple, il peut se faire qu’une estimation effective existe, mais 
les formules de calcul sont tellement compliquées, qu'on est oblige 
de se contenter d’une autre estimation, dont la variance est un peu 
plus grande. Parfois on admet, pour simplifier les calculs, des esti- 
mations légèrement biaisées. En tout cas, le choix d’une estimation 
doit être précédé d’un examen critique des possibilités. 


14.2. Estimations de l'espérance mathématique 
et de la variance 


Soit une variable aléatoire X d'espérance mathématique m et de 
variance D inconnues. Les nr expériences indépendantes en ont fourni 
les valeurs X,, X2, ..., X,. Il y a lieu de trouver les estimations 
consistantes et non biaisées des paramètres m et D. 

Pour l'estimation de l'espérance mathématique il est naturel de 
prendre la moyenne arithmétique des valeurs observées qu’aupara- 
vant nous avons désignée par m* : 


m= m° — = . (14.2.1) 


Il est facile de voir que cette estimation est consistante : en vertu 
de la loi des grands nombres, lorsque z7 augmente, m converge en 


probabilité vers m. L'estimrtiion m est également non biaisée, en 
effet : : 


n 


- À" 
M Im) = = = m. (14.2.2) 


La variance de cette estimation est: 


DIm]=<D. (14.2.3) 


Une estimation est effective ou non suivant la loi de répartition 
de X. On peut montrer que si X est normalement répartie, sa varian- 
ce (14.2.3) est minimale possible, et donc l'estimation m est effec- 
tive. Ceci peut ne pas être vrai pour d'autres lois de répartition. 
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Passons maintenant à l’estimation de la variance D. A première 
vue l'estimation la plus naturelle paraît être la variance statistique: 


D (Xi— m)?2 
D° = = — , (14.2.4) 


(14.2.5) 


Nous allons vérifier que cette estimation est consistante. A cet. 
effet exprimons-la en fonction du moment initial d'ordre deux {for- 
mule (7.4.6)] : 


D' == me. (14.2.6) 


Le premier terme du second membre, qui est la moyenne arith- 
métique de x valeurs observées de la variable aléatoire X°, converge 
en probabilité vers M [X*] — &> {X]. Le second terme converge en 
probabilité vers m°; donc la grandeur (14.2.6) converge en probabilité 
vers 


&> [X]—m°=D, 


ce qui signifie que l'estimation (14.2.4) est consistante. 

Vérifions également que l'estimation D* est non biaisée. À cet 
effet substituons dans la formule (14.2.6) au lieu de m son expression 
(14.2.5), il vient: 


n n = 
2 Xi 2 X 
D* _ 1=1 1=1 _ 


n 
ñn 
DA 2x 2 a XX 


i= 1 
(14.2.7) 
L'espérance mathématique de la grandeur (14.2.7) est : 


MiD°)= TS MIX S DMIXIXT.  (44.2.8) 


Îmx | i<j 
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Comme la variance D* ne dépend pas du choix de l'origine des 
coordonnées, plaçons celle-ci au point m. On a alors: 


M [IX] = M IX1] =D: 2 MIX?]=r»D, (14.2.9) 
MIXX) = M XX] = Kuy=0. (14.2.10) 


La dernière égalité est due à ce que les expériences sont indépendantes. 
En substituant (14.2.9) et (14.2.10) dans (14.2.8) on obtient : 


MID =" D. (14.2.11) 


On voit que D* est uneestimation biaisée de D, 
car son espérance mathématique n'est pas égale à D mais lui est un 
peu inférieure. En utilisant l'estimation D* au lieu de D, on commet 
une certaine erreur systématique en moins. Pour faire disparaître 
ce biais il suffit d'introduire une correction en multipliant la gran- 


7. On obtient alors: 


deur D* par Ra 


7 eg” n Cned 
DS (Xi—m}2 S (Xi— my}? 
R_ pe _ 1=1 _R ist 
n — 1 Dre n n—1 n — 1 


C'est cette variance statistique « corrigée » que nous allons adopter 
pour l'estimation de D: 


D (Xi—m} 
a 1=1 
D = —j (14.2.12) 
Comme le facteur = 7 T tend vers l’unité pour 7z—- et que l'estima- 


tion D* est consistante, l'estimation D le sera également *). 
Souvent au lieu de (14.2.12) il est plus commode d'utiliser une 

autre formule qui lui est équivalente et où la variance statistique 

s'exprime en fonction du moment initial d'ordre deux, soit : 


D=| im |", (44.2.13) 


n n —1 


Il est évident que pour des x grands les estimations biaisée D° 


et non biaisée D différeront très peu et il n’y a pas lieu d'introduire 
de facteur correctif. 


*) L'estimation D de la variance D n'est effective. Cependant dans 
le cas de la répartition normale elle se trouve être « asymptotiquement effec- 
tive », c'est-à-dire pour n —> le rapport de la variance la variance mini- 
male possible tend vers l'unité. 
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Résumons les règles de traitement d’un nombre restreint de don- 
nées statistiques. 

Si T4, Z2, + + +, Zn SOnt les valeurs que prend lors de n expériences 
indépendantes la variable aléatoire À d'espérance mathématique m 
et de variance D inconnues, pour estimer ces paramètres il y a lieu 
d'utiliser les valeurs approchées (estimations) suivantes : 


Z{ 
ss im 1 : 
m = à s 
__. D (1m) 
D = =— (14.2.14) 
ou 
2 * 
5=\ 
n n—1 


14.3. Intervalle de confiance. Probabilité de confiance 


Dans les paragraphes précédents nous avons envisagé l'estima- 
tion du paramètre inconnu a à l’aide d’un seul nombre. Une telle esti- 
mation est dite ponctuelle. Dans un certain nombre de problèmes 
il ne suffit pas de trouver pour le paramètre une valeur numérique 
convenable, mais il faut estimer également sa précision et sa fiabilité. 
On veut savoir quelles sont les erreurs qu’entraîne le remplacement 


du paramètre a par son estimation ponctuelle a et en quelle mesure 
on peut être sûr que ces-erreurs se trouveront dans certaines limites. 

Ces problèmes sont particulièrement importants lorsque le nom- 
bre de données est insuffisant. Dans ce cas l'estimation ponctuelle 
a est nettement aléatoire et des erreurs importantes peuvent s'intro- 
duire lorsque l’on remplace a par a. 

Pour évaluer la précision et la fiabilité d'une estimation, en 
mathématiques statistiques on utilise les notions d'intervalle de 
confiance et de probabilité de confiance. 

Supposons que pour le paramètre a on ait expérimentalement 
obtenu l'estimation non biaisée a. Estimons maintenant l'erreur 
possible. A cet effet choisissons une probabilité assez grande B (par 
exemple B = 0,9, 0,95 ou 0,99) telle qu’un événement, avec la proba- 
bilité B, puisse être considéré comme certain et déterminons la valeur 
e pour laquelle on a: 


P(la—a|<e) = $. (14.3.t) 
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La gamme des valeurs possibles de l’freur apparaissant lorsque l’on 

substitue a à a sera alors + € ; des erreurs importantes en valeur abso- 

lue apparaîtront seulement avec une petite probabilité « — 1 — B 
Ecrivons (14.3.1) comme suit: 


P(a—e<a<at+e)=f. (14.3.2) 


L'égalité (14.3.2) signifie qu'avec une probabilité égale à B la valeur 
inconnue du paramètre a se trouvera dans l'intervalle: 


= (a —e;a+e) (14.3.3) 
Soulignons une particularité de l'intervalle de confiance. Nous avons 
envisagé auparavant la probabilité pour une variable aléatoire de se 
trouver dans un intervalle déterminé. Ici la grandeur a n'est pas 


— 


[s 4 


QUE SL ES a 


0 << 
ay € æ € az 


Fig. 14.3.1 


aléatoire, par contre l'intervalle J4 est aléatoire. Sont aléatoi- 


res sa position sur l’axe des abscisses, déterminée par le centre a, 
ainsi que la longueur 2e de cet intervalle, car la grandeur e se calcule 
en général d’après des données expérimentales. C'est pourquoi, dans 
le cas présent, il est préférable d'interpréter la grandeur $ non pas 
comme la probabilité pour le point a de se trouver dans l'intervalle 
Is, mais comme la probabilité pour l'intervalle 74 de recouvrir le 
point a (fig. 14.3.1). 

La probabilité B est généralement appelée probabilité de 
confiance, et l'intervalle T8 intervalle de confiance *). Les limites 
da =a—e et a = a + e, de l'intervalle Is, sont appelées li- 
mites de confiance. 

On peut interpréter l'intervalle de confiance comme l'intervalle 
des valeurs du paramètre a compatibles avec les données 
expérimentales et ne les contredisant pas. En effet, si l'on 
considère un événement pratiquement impossible avec une 
probabilité &« — 1 — $,les valeurs du paramètre a pour lesquelles 


|a — a|>> e sont alors en contradiction avec les données expéri- 


mentales, et celles pour lesquelles [a — a|<e sont compatibles 
avec elles. 


Calculons des limites de confiance a, et @. 


+) Sur la figure 14.3.1 l'intervalle de confiance est symétrique par rap- 
port à a, comme nous allons le voir, ceci n'est pas obligatoire. 


20—2823 
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Supposons que pour le paramètre a on ait une estimation non 


biaisée a. Si l’on connaissait la loi de répartition de la variable a, 
il serait très simple de trouver l'intervalle de confiance, il suffirait 
de trouver une valeur & telle que 


P(la—al<e) = $. 
Ce qui complique le problème c’est que la loi de l’estimation a dépend 
de la loi de X et par conséquent de ses paramètres inconnus (en parti- 
culier, du paramètre a lui-même). 

Pour éviter cette difficulté on peut approcher dans l'expression 
de &, bien que très grossièrement, les paramètres inconnus par leurs 
estimations ponctuelles. Lorsque le nombre d'expériences n'est pas 
grand (environ 20 ou 30), ce procédé donne des résultats tout à fait 
acceptables. 

A titre d'exemple, cherchons l'intervalle de confiance de l’espé- 
rance mathématique. 

Supposons que l’on ait effectué 7 mesures indépendantes de la 
variable aléatoire X, d’espérance mathématique m et de variance 
D inconnues. Pour ces paramètres on a obtenu les estimations sui- 
vantes : 


n 
>» x D (Xi—m)3 
__ {1 à D {mi 
RE Ts D=————— ° (14.3.4) 

On demande de construire l'intervalle de confiance 7, correspon- 
dant à la probabilité de confiance $ pour l’espérance mathématique 
m de À. 

Pour résoudre ce problème nous allons exploiter le fait que la 
grandeur m est la somme de nr variables aléatoires X, de même loi, 
alors en vertu du théorème central limite, pour nr suffisamment grand, 
sa loi de répartition est voisine de la loi normale. Dans la pratique 
même pour un nombre relativement petit de composantes (de l’ordre 
de 10 ou 20) la loi de répartition de la somme est presque normale. 


Supposons donc m normalement répartie. L’espérance mathématique 
et la variance d’une loi normale sont respectivement m et Z (voir 


chap. 13 $ 13.3). Supposons D donnée, calculons la grandeur eg 
telle que 


P(im—m|<es) = $. (14.3.5) 


En utilisant la formule (6.3.5) du chapitre 6 écrivons la probabili- 
té dans le premier membre de (14.3.5) à l’aide de la fonction de ré- 
partition normale: 


P(Im—m|< e8)= 20° (22) —1, (14.3.6) 
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où 0 — y? est l'écart quadraätique moyen de l’estimation m. 
L'équation 


donne la valeur eg: 
eo argO* (TE), (14.3.7) 


où arg D* (x) est la fonction inverse de ®* (x), c’est-à-dire une 
valeur de l’argument pour laquelle la fonction normale de répartition 
est x. 


On ne connaît pas exactement la variance D entrant dans l'ex- 
pression de 0%, mais on peut l’approcher par l'estimation D (14.3.4) 


et poser 
O= = V2 (14.3.8) 


On a ainsi approximativement déterminé l'intervalle de con- 
fiance cherché : 


Is = (m— es; m + es), (14.3.9) 
où es est donné par la formule (14.3.7). 
Afin d'éviter, lors du calcul de es, une interpolation inverse dans 


les tables de la fonction ®* (x), il est commode de composer un 
tableau spécial (voir tableau 14.3.1) des 


te = arg D° (+5) 


pour différentes valeurs de $. La grandeur f4 donne, pour la loi nor- 
male, le nombre d’écarts quadratiques moyens qu’il y a lieu de porter 
à droite et à gauche du centre de dispersion pour que la probabilité 
de tomber dans l'intervalle obtenu soit égale à f$. 

L'intervalle de confiance s'exprime comme suit en fonction de ts 


Ip = (M — 10%; M + 180%). 


Tableau 14.3.1 


0,80 1,282 0,86 1,479 0,92 1,750 À 0,97 2,169 
0,81 1,310 0,87 1,513 0,93 1,810 | 0,98 2,325 
0,82 1,340 0,88 1,994 0,94 1,880 | 0.99 2,976 
0,83 1,371 0,89 1,597 0,95 1,960 | 0,9973 | 3,000 
0,84 1,404 0,90 1,643 0,96 2,053 | 0,999 3,290 
0,85 1,439 0,91 1,694 


20) 
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Exemple 1. Supposons qu’on ait effectué 20 expériences sur la variable 
X; les résultats obtenus sont rassemblés dans le tableau 14.3.2: 


Tableau 14.3.2 


Trouver l'estimation m de l’espérance mathématique m de la variable X 
et ee de conne correspondant à la probabilité de confiance B = 0,8. 
Solution. Ona: 


Conf 


20 
r= D > zi = 10,78. 

i-=1 | 
Choisissons pour origine le point z — 10 et calculons d’après la troisième for- 
mule (14.2.14) l'estimation non biaisée D: 


Dans le tableau 14.3.1 nous trouvons t4 — 1,282 et calculons: 
eg = tp0— = 0,072: 
Les limites de confiance sont alors: 
ms = m — 0,072 = 10,71; 
m2 = m + 0,072 = 10,85. 
êt l'intervalle de confiance est: 
Ip = (10,71; 10,85). 


Les valeurs dy paramètre m se trouvant dans cet intervalle sont compa- 
tibles avec les données expérimentales figurant dans le tableau 14.3.2. 


D'une manière analogue on peut trouver l'intervalle de confiance 
pour la variance. 

Supposons que l’on ait effectué nr expériences indépendantes sur 
la variable aléatoire À de paramètres inconnus m et D et que l’on 
ait obtenu pour la variance D l'estimation non biaisée suivante: 


(Xi—m)? 


" 1=1 
D — , (14.3.11) 


Ms 
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où 


me. 
n 


11 y a lieu de construire l'intervalle de confiance approché pour 
la variance. 

La formule (44.3.11) montre que la grandeur D est la somme de 
(X; —m)? 
n — 1 
cune d'elles contient la variable m dépendant de toutes les autres. 
Cependant on peut montrer que lorsque nr augmente, la loi de ré- 
partition de la somme converge vers la loi normale. Dans la pratique 

pour rz — 20 ou 30 cette loi est à peu près normale. 
Supposons qu'il en soit ainsi et calculons l'espérance mathémati- 
que et la variance de cette loi. L'estimation D étant non biaisée, on a: 


M [D] = D. 


Le calcul de la variance D [D] est assez compliqué, c'est pourquoi 
nous en donnerons seulement le résultat : 
eg —— | n — 3 2 
où u, est le moment central d'ordre quatre de À. 

Pour utiliser cette expression il y a lieu d’y substituer les valeurs 
u, et D (même approchées). A la place de D on peut utiliser son esti- 
mation D. En principe le moment central d'ordre quatre peut être 
remplacé par son estimation, par exemple, par la grandeur 


n variables aléatoires de la forme ,interdépendantes, car cha- 


S (Xi—m)t 
us = =, (14.3.13) 


n 


mais une telle substitution donnera une précision insuffisante, car 
pour un nombre d'expériences limité les moments d'ordres élevés 
se calculent avec des erreurs importantes. Cependant souvent dans 
la pratique on connaît’ la forme de la loi de répartition de la varia- 
ble X. On peut alors essayer d'exprimer u, en fonction de D. 

Dans la pratique le plus souvent on rencontre la loi normale, 
dans ce cas le moment central d'ordre quatre s'exprime en fonction 
de la variance comme suit (voir chap. 6, $ 6.2): 


U4 = 3D1, 
et la formule (14.3.12) donne alors: 


ee 3 po n —3 
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OtL 


DID] — 


2 é 
er) D. (14.3.14) 
En rémplaçant dans (14.3.14) l’inconnue D par son estimation D 
on obtient: 

2 


n — 1 


DID] — D, (14.3.15) 


d’où 


o5=y 25. (14.3.16) 


Dans certains cas, lorsque la loi de répartition n’est pas normale, 
mais de forme connue, on peut également exprimer le moment u, 


en fonction de D. Par exemple, pour la loi uniforme (voir chap. 5) 
on a: 


_— a) a? 
né: DE, 
où (&œ, B) est l'intervalle sur lequel cette loi est donnée. Par consé- 
quent : 
Ua = 1,8D*. 
La formule (14.3.12) donne: 


D [D] __ 0.8n + 1.2 D®, 


n(n—1) 
d'où approximativement : 
PE U,8n + 1,2 > Sn 


Même lorsqu'on ne connaît pas la forme de la loi de X, pour estimer 
approximativement la grandeur o> il est conseillé d'utiliser la for- 
mule (14.3.16) si seulement on n’a pas de raisons spéciales de suppo- 
ser que cette loi diffère fortement de la loi normale (c'est-à-dire pos- 
sède un excès positif ou négatif important). 

Si d'une manière ou d’une autre on a trouvé la valeur approchee 
de 063, on peut construire l'intervalle de confiance pour la variance, 
tout comme dans le cas de l'espérance mathématique : 


I8=(D —1n0%; D +t805), (14.3.18) 


où la grandeur t4 pour différentes probabilités $ est donnée dans le 
tableau 14.3.1. 


Exemple 2. Dans les conditions de l’exemple 1 trouver approxima- 
tivement l'intervalle de confiance correspondant à la probabilité de confiance 
B — 0,8 pour la variance de la variable aléatoire X, sachant que X suit une 
loi voisine de la loi normale. 
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Solution. La grandeur 1, est la même que dans l'exemple 1: 


lg —= 1,282. 
La formule (14.3.16) donne: 


OC. —= V/ 2-0.064=0,0207. 
D 19 


La formule (14.3.18) permet de trouver l'intervalle de confiance: 
T8 — (0,043; 0,085). 


hs correspondant des valeurs de l'écart quadratique moyen est (0,21; 
129). 


14.4. Méthodes exactes de calcul des intervalles 
de confiance pour les paramètres d’une variable 
aléatoire normale 


Dans le paragraphe précédent nous avons étudié des méthodes 
approchées de construction des intervalles de confiance pour l’espé- 
rance mathématique et la variance. Le présent paragraphe est con- 
sacré aux méthodes précises de résolution du même problème. Sou- 
lignons que pour le calcul précis des intervalles de confiance il est 
indispensable de connaître à l’avance la forme de la loi de répartition 
de X, alors que dans le cas des méthodes approchées on peut s'en 
dispenser. 

Les méthodes précises de calcul des intervalles de confiance repo- 
sent sur l'idée suivante. Tout intervalle de confiance peut être trou- 
vé à partir de la condition exprimant la probabilité de réalisation de 


certaines inégalités contenant l'estimation a. La loi de l'estimation a 
dépend dans le cas général des paramètres inconnus de la variable À. 
Cependant, dans certains cas on peut passer dans les inégalités de la 


variable aléatoire à à une autre fonction des valeurs observées X;, 
X>, ..., X, dont la loi de répartition ne dépend pas des paramètres 


inconnus, mais seulement du nombre nr d'expériences et de la forme 
de la loi de répartition de X. De telles fonctions aléatoires jouent un 
rôle important en statistique mathématique; elles sont étudiées en 
détail dans le cas de la loi normale. 

Par exemple, on peut démontrer que si X est une variable nor- 
male, la variable aléatoire 


TVR", 14.4.1 
V5 ) 
où 
Ni x; > (X;—m)? 
miel D = i=! : 
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suit la loi de répartition de Student à n — 1 degrés de liberté ; la den- 
sité de probabilité de cette loi est: 


: r(+) 42 =; 
LT TT Lo | (14.4.2) 


où L (x) est la fonction gamma 


(x) = | u*-19"4 qu. 
U 
Il a été démontré également que la variable aléatoire 


Sos (14.4.3) 


est répartie suivant la loi du %?à xz — 1 degrés de liberté (voir 
chap. 7, page 137), dont la densité est donnée par la formule 
suivante : 


V = 


1 1 + 
vu? e * pour v>0, 


kawW=<2?r (=) (14.4.4) 
0 pour v<0. 


Sans nous arrêter sur la démonstration des lois (14.4.2) et (14.4.4) 
nous allons seulement montrer comment celles-ci peuvent être uti- 
lisces pour le calcul des intervalles de confiance pour les paramètres 
m et D. 

Supposons que x expériences indépendantes sur la variable aléa- 
toire À, répartie suivant la loi normale de paramètres inconnus m 
et D, aient fourni les estimations suivantes: 


n 

Xi V'(Xi—m)2 

m = 1=1 : D = 2-1 
n 


As 


n—1 


Il y a lieu de trouver pour les deux paramètres les intervalles de con- 
fiance correspondant à la probabilité de confiance $. 

Nous allons tout d’abord déterminer l'intervalle de confiance 
pour l'espérance mathématique. Il est naturel de prendre cet inter- 


valle symétrique par rapport à m ; désignons par eg la moitié de cet 
intervalle. La grandeur eg doit être telle que 
P(lm—m|<es ) = $. (14.4.5) 


Dans le premier membre de l'égalité (14.4.5) nous allons substituer 
à la variable aléatoire m la variable aléatoire T répartie suivant la 
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loi de Student. A cet effet nous multiplions les deux membres de 
— n 
l'inégalité | m — m | < eg par le facteur positif V3: 


Vrim-m| Ep _ 
CR 


ou, en utilisant la désignation (14.4.1): 


P L | —f. (14.4.6) 


Cherchons un nombre #8 tel que 


P(IT|<ts) = $. (14.4.7) 
La grandeur #$ est donnée par la condition: 
(8 
P(IT| << ts) = | Snutt)dt=B. (14.4.8) 
—t$ 


En vertu de la formule (14.4.2),.8, ; (t) est une fonction paire; 
ainsi à partir de (14.4.8) on obtient : 


‘8 
2 | Sn (t)at=B. (14.4.9) 


0 
L'égalité (14.4.9) donne la grandeur #4 en fonction de B. Si l’on dis- 
pose d’une table des valeurs de l’intégrale 


x 


Y (x) =2 | Sn (8) dt, 


on peut trouver la grandeur f$ par interpolation inverse dans cette 
table. Cependant il est plus commode de dresser à l’avance une 
table des valeurs de #8 (voir table 5 de l’annexe). Cette table donne 
les valeurs de #$ en fonction de la probabilité de confiance $ et du 
nombre de degrés de liberté r7 — 1. Prenant ts dans la table 5 et po- 


sant _ 


on trouve la moitié de la largeur de l'intervalle de confiance J, et 
cet intervalle lui-même, soit: 


n=(ñ-#y/Din+oy 5). «sin 
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Exemple 1. Supposons qu'on ait effectué 5 expériences indépendantes 
sur la variable aléatoire X répartie suivant une loi normale de paramètres 
inconnus m et oc. Les résultats des expériences sont rassemblés dans le tableau 


(14.41). 
Tableau 14.4.1 


pale ls 


5) 


ù | _2,5 | 3,4 | 2,0 | 10 | 2,1 


Trouver l'estimation m de l'espérance mathématique et déterminer l'in- 
tervalle de confiance 7, à 90 % (c'est-à-dire l'intervalle correspondant à la 
probabilité de confiance f — 0,9). 

Solution. On a: 


m=0,4; D = 6,6. 
La table 5 de l'annexe donne pour n — 1 — 4, B = 0,9: 
tp —= 2,13, 


Ep = {g 2 = 2,45. 


L'intervalle de confiance sera : 
Ig = (m— eg; m + eg) = (—2,05; 2,85). 


Exemple 2. Pour les conditions de l'exemple 1 du &$ 14.3, supposant 
la variable X normalement répartie, trouver l'intervalle de confiance exact. 
Solution. Dans la table 5 de l'annexe on trouve pour n — 1 = 19 


et B = 0,8. lg = 1,328, d'où eg = 5 2= 0,0704. 


En comparant ce résultat avec la solution de l'exemple 1 du 8 14.3 
(24 — 0,072), on trouve que la différence est insignifiante. Les intervalles 
de confiance trouvés par les méthodes approchée et exacte coïncident à deux 
chiffres décimaux près, soit: 


14 = (10,71; 10,85). 


d'où: 


Calculons maintenant l'intervalle de confiance pour la variance. 
Soit l'estimation non biaisée de la variance: 
Lis Cond 
D (Xi—m)? 
T is! 
D= n — 1 


Exprimons D en fonction de la grandeur V (14.4.3) répartie suivant 
la loi du %° (14.4.4): 


De (14.4.12) 


n — À 
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Connaissant la loi de V on peut trouver l'intervalle ig qui la con- 
tient avec une probabilité égale à 8. 

La figure 14.4.1 donne la loi de répartition k, _; (v) de Y. 

Le problème qui se pose est comment choisir l'intervalle ig. Si la 
loi de répartition de V était symétrique (comme la loi normale ou la 
loi de Student), il serait naturel de prendre l'intervalle ig symétri- 
que.par rapport à l'espérance mathématique. Dans notre cas la loi 


ka-1(v) 


0 DEEE RES SERRE CE an 
lg 
Fig. 14.4.1 


k,-1 (v), n'est pas symétrique. On s'accorde à situer l'intervalle à} 
de telle sorte que les probabilités pour la variable V de se trouver 
à l'extérieur de l'intervalle à droite et à gauche (surfaces hachurées 
sur la figure 14.4.1) soient les mêmes et égales à : 


@œ  1—$P 


Er 
Pour déterminer l'intervalle is répondant à cette condition nous 
allons utiliser la table 4 de l'annexe pour les nombres +“ tels que 


P(V> x) = p, 


V étant la variable répartie suivant la loi du x* à r degrés de liberte. 
Icir — n — 1. Fixons un quelconque r = nr — 1, nous trouvons dans 
la ligne correspondante de la table 4 deux valeurs de x“ : l’une corres- 


pondant à la probabilité p; =+ et l'autre à la probabilité 


Pa = 1 — F . Désignons ces valeurs par xi et 42 qui sont respecti- 


vement les limites droite et gauche de l'intervalle ig. 

Déterminons maintenant, d’après l'intervalle ig, l'intervalle de 
confiance cherché 7$ pour la variance D, ayant pour limites D, et D: 
et recouvrant le point D avec une probabilité égale à $: 


P (D, < D < Di) = f. 


Proposons-nous de construire un intervalle 78 = (D;, D>) tel qu'il 
recouvre le point D si et seulement si la variable V se trouve dans 
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l'intervalle is. Montrons que l'intervalle 


__fD(n—1). D(n—1) 
B=(—— TT — } (14.4.13) 
satisfait à cette condition. En effet, les inégalités : 
D (n—1) D (n—1) 
ge < D; a > D 


sont équivalentes aux inégalités : 
V<X; V>x 


celles-ci étant vérifiées avec une probabilité égale à $. Nous avons 
ainsi déterminé l'intervalle de confiance pour la variance, celui-ci 
est donné par la formule (14.4.13). 


Exemple 3. Trouver l'intervalle de confiance pour les conditions 
de l” kom ple L du $ 14.3, sachant que la variable X est normalement répartie. 


Solution. On a B—=0,8; œ = 0,2; 5 = 0,1. Pour r = n — 1 — 


— 19 dans la table 4 de l’annexe on trouve: 


pour py=-=0,1 ; x3= 27,2; 


pour p—i—%=09;  x=11,65. 
La formule (14.4.13) permet de déterminer l'intervalle de confiance pour 


la variance: 
T8 = (0,045; 0,104). 


L’ intervalle correspoñdant pour l'écart quadratique moyen est (0,21 ; 0,32). 
Cet intervalle n'est que légèrement supérieur à l'intervalle (0,21 ; 0,29) obtenu 
dans l'exemple 2 du $ 14.3 par la méthode approchée. 


14.5. Estimation d’une probabilité d’après 
la fréquence de réalisation d'un événement 


Dans la pratique souvent il y a lieu d'estimer la probabilité in- 
connue p de l'événement À d’après sa fréquence p* dans n expérien- 
ces indépendantes. 

Ce problème est très voisin des problèmes étudiés dans les para- 
graphes précédents. En effet, la fréquence de l'événement À dans n 
expériences indépendantes n’est rien d'autre que la moyenne arith- 
métique des valeurs observées de la variable X, qui dans chaque 
expérience prend la valeur 1 associée à la réalisation de l'événement 
A, et O dans le cas contraire: 


pi. (14.5.1) 
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. Rappelons que l’espérance mathématique de la variable X est 
£_ale à p et sa variance à pq, où q == 1 — p. L'espérance mathéma- 
tique de la moyenne arithmétique est égaleraent égale à p, soit: 


M \p*l = p, (14.5.2) 


c'est-à-dire que l'estimation p * de p est non biaisée. 
La variance de p* est: 


DIp*"|= (14.5.3) 


On peut montrer que cette variance est la plus petite possible, 
c'est-à-dire que l’estimation p* de p est effective. 

Ainsi, il semble raisonnable dans tous les cas d'adopter pour 
l'estimation ponctuelle de la probabilité inconnue p la fréquence p*. 
Il est intéressant de connaître la précision et la fiabilité de cette esti- 
mation, c’est-à-dire de déterminer l'intervalle de confiance pour la 
probabilité »p 

Bien que ce problème soit un cas particulier du problème de la 
détermination de l'intervalle de confiance pour l'espérance mathé- 
matique étudié précédemment, il y a lieu de le résoudre séparément. 
En effet, X est une variable aléatoire discrète qui ne peut prendre 
que deux valeurs, 0 et 1. De plus, il existe une relation fonctionnelle 
entre son espérance mathématique p et la variance pq = p (1 — p), 
ce qui facilite le calcul de l'intervalle de confiance. 

Considérons d’abord le cas le plus simple, lorsque le nombre d'’ex- 
périences z est relativement important et la probabilité p n’est ni 
trop grande ni trop petite. On peut considérer alors que la fréquence 
p * de l'événement est répartie suivant une loi voisine de la loi nor- 
male *). Les calculs montrent que cette hypothèse est vraie même 
lorsque le nombre d'expériences z n’est pas très important : il suffit 
que les deux grandeurs np et nq soient supérieures à quatre. Nous 
supposons ces conditions remplies et donc la fréquence p* normale- 
ment répartie. Les paramètres de cette répartition sont : 


(Mpr= Pi Ope =) +. (14.5.4) 


Supposons tout d’abord p connue. Fixons une probabilité de confian- 


ce et déterminons l'intervalle (p — es, p + eg) tel que la grandeur 
p* y tombe avec une probabilité B, c’est-à-dire: 


P([p°—p|< ee) =6. (14.5.5) 


*) La fréquence d'un événement pour # expériences indépendantes est 
une variable aléatoire discrète ; lorsqu'on dit que sa loi de répartition est voisine 


de la loi normale, on a en vue la fonction de répartition et non pas la densité 
de probabilité. 
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La grandeur p* étant normalement répartie, on a: 


£ 
PAp°—pl<es)=20 (55) —1=8. 
d’où, tout comme dans le 8 14.3: 


Ep = Ops arg D° (8) ; 


où arg ® * est la fonction inverse de la fonction de répartition ®*. 
Pour calculer f introduisons 
la notation: 
tp — arg O° (5) à 
On a alors 
ep — {pOpe, (14.5.6) 


où ## est donné par le tableau 
14.3.1. 

Ainsi, avec une probabilité 
égele à B on peut affirmer que 


lP°—pl<te/ À. (445.7 
Fig. 14.5.1 En fait on ne connaît pas la gran- 
deur p; cependant l'inégalité 
(14.5.7) sera vérifiée avec une probabilité égale à B que l’on connaisse 
ou non la probabilité p. Après avoir obtenu expérimentalement une 
valeur de la fréquence p *, on peut en utilisant l'inégalité (14.5.7) 
trouver l'intervalle 74 recouvrant avec une probabilité égale à $ 
le point p. En effet, on peut écrire cette inégalité de la manière sui- 
vante : 
de 


(p°—p} <— p(1—p) (14.5.8) 


et lui donner une interprétation géométrique. Portons la fréquence 
p * sur l’axe des abscisses et la probabilité p sur l’axe des ordonnées 
(fig. 14.5.1). Le lieu géométrique des points dont les coordonnées p* 
et p satisfont à l'inégalité (14.5.8) sera la partie interne de l’ellipse 
passant par les points (0, 0) et (1, 1) et dont les tangentes en ces 
points sont parallèles à l'axe Op *. Comme la grandeur p * ne peut 
tre ni négative, ni supérieure à l'unité, le domaine D correspondant 
à l'inégalité (14.5.8) doit encore être limité à gauche et à droite par 
les droites p * = 0 et p* = 1. Nous pouvons maintenant pour une 
valeur quelconque p*, obtenue expérimentalement, déterminer 
l'intervalle de confiance 7, qui avec une probabilité égale à f recou- 
vrira la valeur inconnue p. À cet effet, menons par le point p * une 
droite parallèle à l’axe des ordonnées. Les limites du domaine D 
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en couperont l'intervalle de confiance 75 — (p1, p2). En effet, le 
point M d'abscisse aléatoire p * et d’ordonnée déterministe (mais 
inconnue) p avec une probabilité f se trouvera à l’intérieur de l'ellip- 
se, c’est-à-dire l'intervalle 74 recouvrira le point p avec une probabi- 
lité f. 

Le dimensions ‘4 la configuration de |” «ellipse de confiance » 
dépendent du nombre d'expériences nr. Plus nr est grand, plus l’el- 
lipse est allongée et plus l'intervalle de confiance est étroit. 

On peut trouver les limites de confiance p, et p2 à partir de la 
relation (14.5.8) en y remplaçant l'inégalité par l'égalité. En résol- 
vant l'équation du second degré en p on trouve deux racines : 


4 ! (4 p* 4 t 
+4) ET 


Pi = t ? 
ET 
(14.5.9) 
*(1—p° 1 
P°+r L,47/2 = £ += L 
P2 = 


L'intervalle de confiance pour la probabilité p sera 


T8 = (Ps, P2). 


Exemple 1. La fréquence p* de l'événement À dans une série de 
100 expériences s’est trouvée gaie à 0,78. Déterminer l'intervalle de confiance 
à 90 % pour la probabilité de l'événement A. 

Solution. Vérifions tout d'abord s’il est possible d'utiliser la loi 
normale; à cet effet calculons les grandeurs np et ng. En supposant p = p* 
on obtient : 

np=np* =78; ng=n(i—p*) = 22. 


Ces deux grandeurs sont nettement supérieures à quatre, donc la loi nor- 
male est applicable. Le tableau 14.3.1 donne, pour B = 0,9, 44 = 1,643. On ob- 
tient alors à partir des formules (14.5.9): 


pi — 0,705; pz = 0,840; J$ — (0,705; 0,840). 
ne 
Notons que lorsque r augmente, les grandeurs Ur dans 


les formules (14.5.9) tendent vers zéro ; à la limite ces formules devien- 
nent : 


Pa = P° —ts PCR, | 
à (14.5.10) 
— n° p° (1— p*°) 
P2= P ap Een 


Ces formules peuvent être obtenues directement, en utilisant la 
methode approchée du $ 14.3 de détermination de l’intervalle de 
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confiance pour l'espérance mathématique. Les formules (14.5.10) 
peuvent être utilisées pour des z grands (de l’ordre d’une centaine), 
si seulement la probabilité p n’est ni trop grande et ni trop petite 
{lorsque les deux grandeurs np et rq sont de l’ordre de 10 au plus 


Exemple 2. Supposons que l'on ait effectué 200 expériences; la 
fréquence de l'événement A est p* — 0,34. Déterminer approximativement 
l'intervalle de confiance à 85 % à l’aide des formules (14.5.10). Comparer 
le résultat obtenu avec celui des formules exactes (14.5.9). 

Solution. B = 0,85; le tableau 14.3.1 donne tp — 1,439. Enintro- 


duisant le facteur 
/ PORT % 0,033 


L — D% 
8 ET + 0,048. 


d'où la valeur approchée de l'intervalle de confiance: 
T8 = (0,292; 0,388). 


Les formules (14.5.9) permettent de trouver des valeurs plus exactes p; — 
— 0,294; pz = 0,389 qui diffèrent peu des valeurs approchées. 


on obtient : 


Ci-dessus nous avons déterminé l'intervalle de confiance pour un 
nombre suffisamment grand d'expériences, lorsque la fréquence pou- 
vait être considérée normalement répartie. Si le nombre d'’expérien- 
ces est petit (ou si la probabilité p est très grande ou très petite) 
cette approximation n'est pas vraie. Dans ce cas l'intervalle de con- 
fiance doit être déterminé non pas à partir de la loi approchée, mais 
de la loi exacte de répartition de la fréquence. Comme on peut le voir 
la fréquence suit une loi binomiale étudiée dans les chapitres 3 et 4. 
En effet, le nombre d'’apparitions de l'événement À dans nr expé- 
riences est réparti suivant la loi binomiale: la probabilité pour l’é- 
vénement À d’apparaître exactement m fois est égale à : 


mn=CRp"i, (14.5.14) 


et la fréquence p* n’est rien d'autre que le nombre d’apparitions de 
l'événement divisé par le nombre d'expériences. 

A partir de cette répartition on peut déterminer l'intervalle de 
confiance Z8 tout comme dans le cas de la loi normale pour des nr 
grands (page 317). 

Supposons tout d’abord la probabilité p connue et calculons l'in- 
tervalle de fréquences p’, p°, dans lequel avec une probabilité 
B — 1 — x se trouve la fréquence p * de l'événement. 

Pour un nr grand nous avons utilisé la loi normale et nous avons 
pris l'intervalle de confiance symétrique par rapport à l'espérance 
mathématique. La répartition binomiale (14.5.11) n'est pas symé- 
trique. De plus-il peut se faire que l'intervalle où l'événement tombe 
avec une probabilité égale exactement à B peut ne pas exister (car la 
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fréquence est une variable aléatoire discrète). C’est pourquoi nous 
allons prendre pour intervalle p?, p; le plus petit des intervalles, 
tel que la probabilité pour l'événement de se trouver à gauche et à 


droite soit supérieure à s.. 
Tout comme nous avons déterminé le domaine D pour la loi nor- 
male (fig. 14.5.1), nous pouvons pour chaque n et un B donné déter- 
miner le domaine à l’intérieur duquel la valeur de la probabilité p est 
compatible avec la valeur observée de la fréquence p * 


I, 00p 


0,90 


v 
#4 


| | DZ; ss 


0 GI0 020 0530 040 0,50 0,60 070 080 G9 1,00p° 
Fig. 14.5.2 


Sur la figure 14.5.2 on peut voir les courbes limitant ces domaines 
pour différents r pour une probabilité de confiance f = 0,9. Sur l’axe 
des abscisses on a porté la fréquence p *, sur l’axe des ordonnées, 
la probabilité p. Chaque paire de courbes correspondant à x donné 
détermine l'intervalle de confiance associé à une valeur donnée de la 
fréquence. En toute rigueur les limites des domaines doivent être 
échelonnées vu que la fréquence est discrète, mais pour plus de 
commodité elles sont représentées comme des courbes continues. 

Pour déterminer l'intervalle de confiance 7, à l'aide de ces cour- 
bes il y a lieu de procéder comme suit : sur l’axe des abscisses on porte 
la valeur observée de la fréquence p *, on mène par ce point une droite 
parallèlement à l’axe des ordonnées et on marque les points d’inter- 
section de cettc droite avec le couple de courbes correspondant à un 


21—2823 
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nombre d'expériences n; les projections de ces points sur l'axe des 
ordonnées seront les limites p,, p2 de l'intervalle de confiance Ja. 

Pour un n# fixé les courbes limitant le « domaine de confiance » 
sont données par les équations suivantes : 


S Cap" (1— pe; (14.5.12) 
m=R 
R 
S Crp"(1— p}"-" = (14.5.13) 
m -0 
où 
k = np * 


est le nombre de réalisations de l’événement. 

La résolution de l'équation (14.5.12) par rapport à p donne la li- 
mitc inférieure p, « du domaine de confiance »; d’une manière analo- 
ue on peut trouver p, à partir de (14.5.13). 

Pour éviter de résoudre ces équations chaque fois qu'il est besoin, 
on peut tabuler (ou représenter graphiquement) les solutions pour 
plusieurs valeurs fréquentes de la probabilité de confiance $. Par 
exemple, dans l'ouvrage de I. Dounine-Barkovski « Théorie des pro- 
babilités et statistique mathématique. Applications techniques » 
(en russe) on peul trouver des tables donnant p, et p, pour B — 0,95 
et B 0,99; le graphique de la figure 14.5.2 est également emprunté 
à cel ouvrasc. 


E x cmple 3 Avec une probabilité de confiance B — 0,9 trouver les 
limites de confiance p, ct p. pour la probabilité d'un événement si lors de n 
expériences sa fréquence s'est trouvée être égale à p* — 0,4. 

Solution. Par construction (pointillé sur la figure 14.5.2) pour p* — 
= 0.4 et n: 0 on trouve p, & 0,28; p2 & 0,52 


La méthode des intervalles de confiance permet également de 
répondre, ne serait-ce que d’une manière approchce, à une autre ques- 
Lion très importante pour la pratique : quel est le nombre d'’expérien- 
ces # pour lequel, avec une probabilité de confiance B, l’errcur qu'on 
fait en remplaçant la probabilité par la fréquence ne soit pas 
supérieure à une certaine valeur ? 

Pour résoudre des problèmes de ce genre il est peu commode 
d'utiliser directement des graphiques du type de ceux de la figure 
14.5.2, il y a lieu de Îes reconstruire, en représentant les limites de 
confiance en fonction du nombre d'expériences n. 


Exemple 4. Lors de 25 expériences l'événement À s’est produit 12 fois. 
Trouver approximativement le nombre d'expériences nécessaires pour qu'avec 
une probabilité f — 0,9 l'erreur commise en remplaçant la probabilité par 
la fréquence ne soit pas supérieure à 20 %. 
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Solution. L'erreur maximale admissible est: 
= 0,2-0,48 — 0,096 = 0,1. 


A partir des courbes de la figure 14.5.2 construisons un nouveau prpoique 
en portant sur l’axc des ahscisses le nombre d'expériences # et sur l'axe des 
ardonnées les limites de confiance pour la probabilité (fig. 14.5.3). La médiane 
parallèle à l'axe des abscisses correspond à la fréquence observée de l'évenc- 


ment p* — — 0,48. Au-des- 


sus ct au-dessous de la droite 
p = p* — 0,48 sont tracées les 
courbes p, (n) et p2 (n) repré- 
sentant les limites de confiance 
supérieure et inférieure en fonc- 
tion de n. Le domaine entre 
les courbes déterminant l'inter- 


valle de confiance est hachuré. RS 
De part et d'autre de la droite 050 RS Re RECRCEE 
p = 0,48 les hachures croisées ms 


délimitent le domaine plus 
étroit correspondent à 20 % de 
l'erreur admissible. La figure 
14.5.3 montre que l'erreur entre 
dans les limites imposées pour 
un nombre d'expériences de 
l’ordre de 100. 


Notons qu'après un Fig. 14.5.3 
nombre requis d'expériences 
il peut s'avérer nécessaire de vérifier de nouveau la précision de 
calcul de la probabilité d'après la fréquence, car en général on obtient 
une autre valeur de la fréquence p * différente de celle observée dans 
les expériences antérieures. I] peut se faire que le nombre d’expérien- 
ces soit encore insuffisant pour assurer la précision requise, et qu'il 
y aura lieu de l’augmenter un peu. Cependant cette première appro- 
ximation peut étre mise à la base des calculs préalables d'une série 
d'expériences du point de vue du temps nécessaire, du coût, etc. 

Dans la pratique parfois il y a lieu de déterminer l'intervalle 
de confiance pour la probabilité d'un événement, lorsque la fréquence 
obtenue expérimentalement est égale à zéro. Généralement c’est le 
cas des expériences où la probabilité de l’événement étudié est très 
petite (ou au contraire très grande, ce qui rend très petite la probabili- 
té de l'événement contraire). 

Supposons, par exemple, qu’on effectue des essais de défaillance 
d’un appareil. Lors des essais l’appareil n’a eu aucune défaillance. 
Re la probabilité maximale possible de défaillance de l'appareil 
étudié. 

Posons ce problème sous une forme générale. Aucune des n expt- 
riences indépendantes n'a réalisé l'événement 4. Pour une probabili- 
té de confiance $ donnée, déterminer l'intervalle de confiance pour 
la probabilité p de l'événement À, plus exactement trouver sa limite 


5.) 1 
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supérieure pP2, la limite inférieure p, étant évidemment égale 
à zéro. 

Le problème posé est un cas particulier du problème général de la 
détermination de l'intervalle de confiance d'une probabilité, mais vu 
ses particularités, il mérite une étude spéciale. Tout d’abord la mé- 
thode approchée de détermination de l'intervalle de confiance (dans 
laquelle on suppose normale la loi de répartition de la fréquence), 
exposée au début de ce paragraphe n’est pas applicable ici, car la 
probabilité p est très petite. La méthode exacte basée sur la loi bino- 
miale reste applicable, mais admet d'importantes simplifications. 

Nous allons raisonner de la manière suivante. Lors de nr expérien- 
ces a été réalisé l’événement B consistant dans la non-apparition de 
l'événement À. Il y a lieu de trouver la valeur maximale p = p: 
« compatible » avec l'événement observé B, supposant « incompati- 
bles » avec B les valeurs de p pour lesquelles la probabilité de l’évé- 
nement B est inférieure à &« = 1 — $. 

Il est évident que quelle que soit toute la probabilité p de l’événe- 
ment À, la probabilité de l’événement observé B est égale à: 


P(B)=(1—p}". 
En posant P (B) = « on obtient l'équation suivante pour p:: 


(1 — p2)" = 1 —B, (14.5.14) 
d’où 


pe=i1—#1—$. (14.5.15) 


Exemple 5. La probabilité d'une explosion spontanée des vapeurs 
d'essence secouée est inconnue mais peut être supposée assez petite. On a effec- 
tué 100 expériences, aucune explosion n’a été enrezistrée. Déterminer la limite 
supérieure de l'intervalle de confiance à 90 % pour la probabilité d’explosion. 

Solution. La formule (14.5.15) donne: 


pa=1—"7/1—0,9—1—"Y 0,1, 
log" y/0,1—0,01 log 0,1 =:1,9900, 
10/0,1= 0,977, p2=1—0,977—0,023. 


Considérons un autre problème lié au précédent. L'événement À 
de petite probabilité p n’a pas été observé lors de x expériences. 
Pour une probabilité de confiance B donnée, trouver le nombre d'ex- 
périences » à effectuer pour que la limite de confiance supérieure de la 
probabilité de l'événement soit égale à une valeur donnée p. 

La solution de ce problème est donnée directement par la formule 
(14.5.14) : + 

Og (1 — 
R = jo (= p)): (14.5.16) 


Exemple 6. Dans combien d'expériences il faut constater un travail 
sans défaillance d’un appareil pour affirmer avec une certitude de 95 % que, 
dans la pratique, une panne surviendra dans moins de 5 % des cas? 
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Solution. D'après la formule (14.5.16) pour B = 0,95, p2 = 0,05 on a: 


En arrondissant par excès on obtient: 
n = 59. 


Vu le caractère approximatif des calculs effectués, on peut utiliser, 
à la place des formules (14.5.15) et (14.5.16), des formules approchées 
plus simples. Ces dernières peuvent être obtenues en supposant que 
le nombre d’apparitions de l'événement À, lors de r expériences, est 
réparti suivant une loi de Poisson d'espérance mathématique a = np. 
Cette hypothèse est approximativement vérifiée lorsque la probabili- 
té p est relativement petite (voir chap. 5, $ 5.9). On a: 


P(B)ze”?, 
alors au lieu de la formule (14.5.15) on obtient : 
pe = U—R (14.5.17) 
et au lieu de la formule (14.5.16) : 
A Le PS (44.5.18) 
P2 


Exemple 7. Trouver la valeur approximative de p, pour les condi- 
tions de l'exemple 5., 
Solution. D après la formule (14.5.14): 


— 1n 0,1 2,303 
Pa — — "1400 — 002 


Ses Ch on retrouve le résultat obtenu à l’aide de la formule exacte de l’e- 
xemple 5. 

Exemple 8. Trouver la valeur approximative de n pour les condi- 
tions de l'exemple 6. 

Solution. La formule (14.5.18) donne: 


En arrondissant par excès on trouve n — 60, ce qui diffère peu du résultat 
n = 59 obtenu dans l'exemple 6. 


14.6. Estimations des caractéristiques numériques 
d’un système de variables aléatoires 


Dans les $$ 14.1 à 14.4 nous avons étudié des problèmes d'estima- 
tion des caractéristiques numériques d'une seule variable aléatoire 
pour un nombre d'expériences limité et de détermination des inter- 
valles de confiance pour ces caractéristiques. 
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Des problèmes analogues apparaissent lors du traitement d'un 
nombre limité de données relatives à deux ou plusieurs variables aléa- 
toires. 

Ici nous allons nous limiter à l'étude des estimations ponctuelles 
des caractéristiques d’un système. 

Soit tout d’abord le cas de deux variables aléatoires. 

Les nr expériences indépendantes effectuées sur le système de 
variables aléatoires (X, Ÿ) ont fourni les résultats suivants: 


(ti, Yi)3 (T2, Y2)5 + + + 5 (Zn, Yn). 


Il y a lieu de trouver les estimations des caractéristiques numéri- 
ques du système, à savoir des espérances mathématiques m,, m,, 
des variances D,, D, et de la covariance K,,. 

Ce problème se résout comme dans le cas d'une seule variable aléa- 
toire. Les moyennes arithmétiques seront les estimations non biaisées 
des espérances mathématiques : 


(14.6.1) 


tandis que pour les éléments de la matrice de corrélation on a: 


2 (zi — mx) \ 


im f 
D= n—1 | 
— m,,ÿ? 
5 PA a (14.6.2) 
JE n—1 É 


ff __imi 


S'zi—mx) (yi— my) 
K+y À 


n—1 


La démoustration est analogue à celle donnée dans le $ 14.2. 

Lors du calcul direct des estimations des variances et de la cova- 
riance il est souvent commode d'utiliser la relation existant entre 
les moments statistiques centrés et initiaux, à savoir: 


D =a$[X]—(m£) ; 
Dj= aÿ[Y]— (mi) : (240) 


Kièy=@i.1lX, Y]— mem), 
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où 
DE Da | 
me = — ; [X]= = — ; | 
Zu 2 | (414.64 
my —— » A2 [Y] — n , 


ai,1lX, Y]==—. 


Ayant calculé les moments statistiques à l’aide des formules 
(14.6.3) on peut trouver les estimations non biaisées des éléments 
de la matrice de corrélation à l’aide des formules suivantes : 


D. = D — | 
D,= Dj —— ; (14.6.5) 
Key = K2y — : 


Exemple. Soit un système de doux variables aléatoires: X, la taille 
d'un homme, en cm, et Ÿ, sa pointure. On a effectué 20 expériences. Chaque 
ième expérience a fourni un couple de valeurs (z;, y,). Les résultats sont ras- 
semblés dans le tableau 14.6.1. 


Tableau 14.6.1 


Trouver les estimations des caractéristiques numériques du système (X, Y), 
à savoir des espérances mathématiques, des variances, de la covariance et du 
coefficient de corrélation. 

Solution. Pour simplifier les calculs, choisissons l’origine des coor- 
données au point zo — 170, yo — 40. Ceci nous oblige de passer des variables 
X et Y aux variables X°’ = X — 170, Y’ — Y — 40 (voir tableau 14.6.2). 
Seules les espérances mathématiques changent avec ce changement d'origine, 
les variances et la covariance restent incha : 
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Tableau 14.62 


1 2 1 6 0 0 11 () 2 16 17 C 
2 4 3 7 4 2 12 15 5) 17 | —4 0 
3 5) 1 8 S) 3 13 10 2 18 | —3 1 
4 1 4 9 | —6 0 14 2 — 1 19 1 2 
5) —2 | —2 10 | —2 1 15 4 3 20 9 3 


Portons les valeurs obtenues sur un graphique (fig. 14.6.1). La disposition 
des points sur la figure 14.6.1 laisse entrevoir une certaine relation (une corré- 
lation positive) entre les variables du système. Estimons les caractéristiques 
numériques du système. 


Fig. 14.6.1 


Calculons à l’aide des formules ES les valeurs moyennes de X’ et Y” 
(les estimations des espérances mathématiques) : 
20 


et, en reportant l’origine à zéro: 
Max =170+3,1— 173,1, 


mm, = 40 + 1,7=—41,7. 
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Calculons les moments statistiques initiaux deux des variables X” et Y’: 
20 
a X'1=S S'2=43.6, 
im 1 


20 
1 — À 2 
ct{Yl=> D yi=5.9. 
i=1 


Trouvons d'après les formules (14.6.3) les variances statistiques des varia- 
bles X’ et Y” (&ales à celles du X et Y): 


D? = 43,6 — 3,12— 33,99, 
D}=5,9—1,73= 3,01. 
Pour trouver les estimations non biaisées il y a lieu de multiplier les va- 


: re n 20 ie 
riances statistiques par nd Il vient: 


D, = 23,38; D, — 3,17. 


| Les estimations des écarts quadratiques moyens ont respectivement pour 
valeurs : 
- = VD,æ4,83, 0, = VDy=1,78. 
La dernière des formules (14.6.4) permet de trouver le moment statistique 
initial d'ordre 1,1: 
; 20 
af 114", Y'] = 5 ziy: = 12,35 
1=1 
et la covariance statistique des variables X”, YŸ” (égale à celle des X, Y): 


Kty=a? 1 [X", Y']—mem,, = 12,35 —3,1.1,7—7,08. 


L'estimation non biaisée s'obtient en multipliant par 2: 


à 19 
Kry = 7,44. 
Ensuite calculons l'estimation du coefficient de corrélation : 
7 sr D = ps 


06, 483-1,18 


La valeur assez grande de r., témoigne de l'existence d’une relation linéaire 
assez importante entre les variables aléatoires X et Y 


Nous allons passer au cas d’un nombre arbitraire de variables 
aléatoires. 
Soit un système de rm variables aléatoires : 


(A4, Âos .. Am): 


Le système a été soumis à r expériences indépendantes ; les résul- 
tats sont rassemblés dans un tableau, dont chaque ligne contient m 
valeurs prises par les variables aléatoires X,, X:, ..., X,, dans une 
expérience (tableau 14.6.3). 
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Tableau 14.6.3 


1 Til Zot TR! Zm1 
2 T2 To2 Th2 TIm2 
i Ti Toi ss Zhi Hé Zmi 
n Tin Ton .… Tkn .. Tmn 


Le double indice dont est affectée chaque valeur figurant au ta- 
bleau se déchiffre comme suit : le premier chiffre désigne le numéro 
de la variable aléatoire, le second le numéro de l'expérience, ainsi 
Zn; est la valeur prise par la variable X, dans l' i-ème expérience. 

Il y a lieu de trouver les estimations des caractéristiques numéri- 
ques du système, à savoir des espérances mathématiques Maxi Mas ee 


se. Mz, € des éléments de la matrice de corrélation : 


KiiKi2 .-. Kim 
K» .. Kom 


Sur la diagonale principale de la matrice de corrélation on a évi- 
demment les variances des variables aléatoires X,, X2, ..., X,: 


Ki = Di; Ko = Di... Kmm = Dm: 


Les estimations des espérances mathématiques sont données par 
les moyennes arithmétiques : 


n 
» Thi 
im! 


(£=1,2.:..:m). (14.6.6) 


Max, = 


Les estimations non biaisées des variances se calculent à l'aide 
des formules : 


: à GŒni—m, ) 
D (14.6.7) 
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et celles des covariances, à l’aide des formules : 
n 


: D Ent.) (zui—Mxy) 
Ky= = 


(14.6.8) 


n—i1 


A partir de ces données on peut trouver les estimations des élé- 
ments de la matrice de corrélation normée: 


Tai = ue , (14.6.9) 
ORO! 
où _ 
où = VD,; oi = V D. (14.6.10) 


Souvent il est plus commode de calculer les estimations des varian- 
ces et des covariances non pas d'après les formules (14.6.7), (14.6.8) 
mais à l’aide des moments initiaux, soit : 


1 < = 
D, = —— {25 Thi — MS, 5 (14.6.11) 
i=1 
a | # Ph pu 
Kh: = —"— {+ » Thil — Max, Max. (14.6.12) 


irs 1 
Exemple. On a effectué 10 observations sur un système de 5 variables 


aléatoires 
X:, X2; Xs: Xi, Xs. 


Les résultats des observations sont réunis dans le tableau 14.6.4 ({ — numéro 
de l'observation, k — numéro de la variable aléatoire). 


Tableau 14.6.4 


1 — 20 — 15 —8 | —-6| —2 
2 40 60 | 120 | 125 | 4130 
3 —25 —30 | —20 | —410 2 
4 — 100 —175 | —35 2 2 
d — 40 —30 | —25 | —30 | —-45 
6 80 30 29 10 2 
7 14 29 25 30 10 
8 80 79 60 10 | —4 
9 — 170 —60 | —30 | —10 0 
10 2 & 10 12 & 


Trouver les valeurs convenables (estimations) des caractéristiques numé- 
riques du système (X1, X2, Xs, X4, X5s), à savoir des espérances mathémati- 
ques et des éléments des matrices de corrélation simple et normée. 
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Solution. Les estimations des espérances mathématiques des varia- 
bles aléatoires X;, X2, Xs, X4, Xs sont données par les moyennes arithmétiques 
calculées par colonne, soit: 


mi=—3,9; mo — —1,6; ms — 12,2; my — 13,3; ms = 9,9. 


Les estimations des variances s’obtiennent à l’aide de la formule (14.6.11)} 
cn élevant au carré tous les éléments d’une colonne du tableau 14.6.4, en pre- 
nant la somme et la moyenne de ces carrés et en retranchant du résultat le 
carré de l'espérance mathématique correspondante, puis en multipliant par 
le facteur correcteur — 9 On obtient ainsi: 

Di = 35,510; D: = 24,4-103; D, = 23,4-102; D, = 19,6-102; Ds = 20,1 103, 
d'où 


Oo = 60; O2 — 49; Où = 48; OO, — 44; Os = 45. 
Pour obtenir les estimations K,, des covariances il y a lieu d'utiliser la 


formule er . Par exemple, pour trouver KÆ,, (estimation de la covariance 
des variables aléatoires X, et X:) il faut multiplier les éléments d'une même 
ligne de la première colonne par ceux de la troisieme du tableau 14.6.4, sommer 
tous ces produits et diviser la somme par n = 10, retrancher du résultat ohtenu 


le produit des estimations correspondantes des espérances mathématiques m;-m3 
ct multiplier la différence obtenue par le facteur correcteur 


— i = ÿ . Nous 
calculons ainsi les éléments de la matrice de corrélation. Vu sa symétrie nous 
n’écrivons que la moitié de la matrice, ayant sorti le facteur commun 103: 

| 35,5 27,8 22,9 11,0 8,3 

: 24,4 21,4 13,0 10,2 

Ky —= 103° 23,4 17,4 17,2. 

19,6 19,3 

20,1 


En divisant chaque élément de cette matrice par le produit des estimations 


des écarts quadratiques moyens correspondants 0,0, nous vbtenons la matrice 
de corrélation normée, soit : 


1,00 0,94 0,76 0,42 0,31 
1,00 0,89 0,59 0,46 


"1 = 1,00 0,81 0,80 
1,00 0,97 
1,00 


14.7. Traitement des données des observations 
sur un couple de variables aléatoires normales 


Dans la pratique il y a souvent lieu de traiter les résultats des ob- 
servations sur deux variables aléatoires normalement réparties. 
Supposons qu'à l’aide d’un certain appareil on détermine n fois les 
coordonnées d’un certain objectif dans le plan. Diverses causes aléa- 
toires font que les résultats des observations ne serépètent pas mais 
changent d’une expérience à l’autre (d’une observation à l’autre). 
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Après nr observations on obtient r points dans le plan z0y 
(fig. 14.7.1). 

Si les erreurs d’observation se composent d'un grand nombre d'’er- 
reurs « élémentaires » indépendantes ou faiblement liées, dues chacune 
à une cause particulière, on peut considérer les valeurs mesurées 
des coordonnées (X, Ÿ) comme normalement réparties. Le problème 
se pose d'estimer, sur la base de l'expérience, les paramètres de cette 
loi, à savoir les coordonnées du centre de dispersion m,,m,, la direc- 
tion des axes principaux de dispersion OË, On, les écarts quadrati- 
ques moyens principaux ©,0n- Le 
problème est analogue dans le cas du Ÿ 
traitement des observations des résul- ° 
tats des tirs par obus: les points ° ray) 
d'impact ont une certaine dispersion : . .  " 
dont il y a lieu de trouver les paramè- (Æn, ÿn) 
tres. 

Nous allons commencer par le cas 
le plus simple, lorsqu'on connaît d'a- 
vance, ne serait-ce qu'approximative- 
ment, la direction des axes principaux 
de dispersion. Le traitement se trouve Fig. 14.7.1 
alors simplifié : en orientant les axes de 
coordonnées parallèlement aux axes principaux de dispersion, on 
peut rendre les variables aléatoires pratiquement indépendantes et 
les traiter indépendamment. La loi de répartition des coordonnées X 
et Y sera caractérisée par quatre paramètres seulement: ce sont les 
coordonnées du centre de dispersion m,, m, et les écarts quadrati- 
ques moyens principaux 0,, 0,-. Les estimations de ces paramètres 
sont données par les formules : 


e (x,,ys) 


ep 
Mx = My = —— ; 


RES 
ÿ (z1—mx)i 
= si . | 
Ox— n — 41 ’ 


(14.7.1) 


{= 1! 
n — 1 


ÿ (yi— my)° 


Oy = 


Passons maintenant à un cas plus compliqué, où la direction des 
axes principaux de dispersion est inconnue d'avance et doit égale- 
ment être déterminée par l'expérience. Dans ce cas il y a lieu d’es- 
timer tous les cinq paramètres, à savoir les coordonnées du centre de 
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dispersion m,, m,, l'angle & et les écarts quadratiques moyens prin- 
cipaux O:, On (fig. 14.7.2). 

Les estimations des coordonnées du centre de dispersion sont com- 
me dans le cas précédent données par les formules : 


i—1 i— 
Mx = = 5 My —— (14.7.2) 


Passons à l’estimation de l'angle &. Supposons connues les direc- 
tions des axes principaux de dispersion et faisons passer par le point 
(m., m,) les axes principaux OË, On (fig. 14.7.2). Dans le système 
EOn les coordonnées du point aléatoire (X, ŸY') seront: 

E = (X — m,) cos a + a. 
HI = —(X — m,) sin « + (Ÿ — m,) cos « 
ou 
mi = } si ; 
7 Kcosa+Ysina; | ( 14.7.3) 
H = —X sin a + Ÿ cos «. 


Il est évident que les variables &, II auront des espérances mathé- 


ÿ 7 


matiques nulles: 
€ MIE = MHI = 0. 


Comme OË, On sont les axes 
principaux de dispersion, les va- 
riables & II sont indépendantes. 
Mais des variables indépendantes 
normales sont également non cor- 
relées; par conséquent il nous 
suffit de trouver une valeur de 
l'angle &, telle que les variables 
E, Hnuesoient pas corrélces. Cette 

Fig. 14.7.2 valeur de & donnera la direction 
des axes principaux de dispersion. 

Calculons la covariance des variables (, II). En multipliant les 
égalités (14.7.3) et en prenant l'espérance mathématique du produit 
on a 


Ken = M IH] = — MIX: sin & COS & LMIXY] (cos® a — sin°?x) + 


+ M [Ÿ?] sin a cos a — — + sin 2a (D, — D,)+ K:,0c0s 2x. 


En annulant cette expression et en divisant les deux membres 
par cos 24 on a: 


ga (14.7.4) 


x — Dy 
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L'équation (14.7.4) donnera deux valeurs de l'angle a: a; et œ 
différant de x/2. Ces deux angles déterminent la direction des axes 
principaux de dispersion *). 

En remplaçant dans (14.7.4) les grandeurs K,,, D,, D, par leurs 
estimations on obtient l'estimation de l'angle «: 


a= 2 arc tg —Kzy 
2 De D 


Cherchons les estimations pour les écarts quadratiques moyens 
principaux O£, On- À cet effet nous allons calculer les variances des 
variables &, H données par les formules (14.7.3) en nous servant du 
théorème sur la variance d’une fonction linéaire: 


D; = D, cos° a + D, sin® « + 2K,, sin « cos a ; 
Dh = D, sin° a + D, cos* a — 2K,, sin «& cos a, 
d'où les estimations des variances principales : 
nn E ie Dyelee Li eahrd (44.7.5) 
Dn= D,sin*a—K,, sin 2a + D, cos° a. 


Les estimations des écarts quadratiques moyens principaux sont : 

me: | (14.7.6) 

Rassemblons toutes les formules à utiliser pour estimer, d’après 

les observations, les paramètres de dispersion de deux variables 

aléatoires (X, Ÿ) normales dans un plan, dans le cas où l’on ne con- 
naît pas à l’avance la direction des axes de dispersion: 


n n 
DE] DIET 
Camd i— 1 Const 1-1 
My — n 9 y n Ù 
— _1 2K 
a —-- arc tg ——=<— ; | (14.7.7) 


D, cos a + K,,Sin 2a + D, sin? a ; 
On = VD. sin® & — K,ysin 2a + D, cos* a, 


*) Notons que l'expression (14.7.4) coïncide avec l'expression (9.2.2) du 
chapitre 9 pour l'angle &, donnant la direction des axes de symétrie de l'ellipse 
de dispersion. 
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où les estimations des variances et des covariances doivent être cal- 
culées par les formules suivantes : 


; à Gi-m) Wim) 
De —; D=— 
do DE (14.7.8) 
a ee "2 Los À 
Ÿ (ci mx) (yi— my) 
5 _i=i 
RE 


ou, ce qui est souvent plus commode, en fonction des moments cen- 
trés par les formules : 


à + 
ns n ici no 
A n—1 n Max | 
n 
2 (14.7.9) 
n nr i=1 21. .{. 
D, = n—{ my; 
n 
D ziyr 
4 n i=1 De 
hey n —! n — Milly 


14.8. Lissage des courbes expérimentales 
par la méthode des moindres carrés 


Le problème du lissage des courbes expérimentales est très voisin 
des questions liées au traitement des données expérimentales étu- 
diées dans le présent chapitre. 

Supposons qu’une expérience ait pour but d'étudier la relation 
entre une certaine grandeur physique y et une autre grandeur physi- 
que z (par exemple, le chemin parcouru par un corps en fonction du 
temps; la vitesse initiale d’un obus en fonction de la température de 
la charge; la portance en fonction de l’angle d'attaque, etc.). On 
suppose que les grandeurs x et y sont liées par la relation fonction- 


nelle 
y = (x). (14.8.1) 


C'est cètte relation qu'il y a lieu de trouver à partir des données 
expérimentales. 

Supposons qu’on ait obtenu expérimentalement une série de 
points et tracé le graphique de y en fonction de z (fig. 14.8.1). Généra- 
lement les points expérimentaux ne forment pas une courbe régulière 
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mais présentent une certaine « dispersion », donc s'écartent d’une 
façon aléatoire de la relation générale perceptible. Ces écarts sont 
liés aux erreurs de mesure inévitables dans toute expérience. 

La question qui se pose est: comment à partir de ces données 
expérimentales trouver la relation existant entre y et x et ceci avec 
la meilleure approximation possible? 

On sait que par nr points quelconques de coordonnées (x;, y;) on 
peut toujours mener une courbe s'exprimant analytiquement par 


Fig. 14.8.1 Fig. 14.8.2 


un polynôme de degré (7 — 1) et passant exactement par chacun des 
points (fig. 14.8.2). Cependant une telle solution du problème n’est 
pas en général satisfaisante, car presque toujours la non-régularité 
des points expérimentaux, comme par exemple sur les figures 14.8.1 
et 14.8.2, est conditionnée non pas par la relation existant entre 
z et y mais uniquement par les erreurs de mesure. On peut facile- 
ment s’en rendre compte en comparant les écarts observés (dispersion 
des points) avec les erreurs éventuelles des appareils de mesure utili- 
sés. 

Très souvent, dans la pratique on se trouve devant le problème 
du lissage des courbes expérimentales. Les données expérimentales 
doivent être traitées de façon à exprimer le plus exactement possible 
la tendance générale qui se dessine dans la relation entre y et x, 
tout en lissant les écarts aléatoires injustifiés, dus aux erreurs inévi- 
tables de l'expérience mème. 

Pour résoudre ce prohlème on utilise généralement la « méthode 
des moindres carrés ». Cette méthode permet, pour une forme donnée 
de la fonction y -= o (x), de choisir ses paramètres numériques de 
telle sorte que la courbe y = œ (x) corresponde de la meilleure dans 
un certain sens façon aux données expérimentales. 

Nous allons dire quelques mots sur la manière de choisir la forme 
de la courbe y = ® (x). Souvent ceci se voit immédiatement en exa- 
minant la relation expérimentale obtenue. Par exemple, les points 


22— 2823 
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expérimentaux représentés sur la figure 14.8.3 laissent indubitable- 
ment penser à une relation linéaire de la forme y = ax + b. La rela- 
tion apparaissant sur la figure 14.8.4 peut être exprimée par un poly- 
nôme du second degré de la forme y = azx° + bx + c. Dans le cas 


Fig. 14.8.3 Fig. 14.8.4 


d’une fonction périodique, on peut souvent utiliser plusieurs harmo- 
niques de la série trigonométrique, etc. 
Souvent la forme de la relation (linéaire, quadratique, exponen- 
tielle, etc.) est donnée par des considérations physiques, et il y a lieu 
de trouver expérimentalement 
a certains paramètres de cette rela- 
tion. 
4 Z4 | Vi Dans ce paragraphe nous 
———— allons étudier la manière dont 
" | z, ÿ on peut choisir les paramètres 
| d’une fonction de forme donnée 
à partir des données expérimen- 
2 | Z2 | Y2 tales. 
Soient les résultats des r expé- 
riences indépendantes disposés 
| moe no dans un tableau statistique sim- 
ple (tableau 14.8.1), où à est le 
i | z; | Yi numéro d'ordre de l'expérience ; 
zi la valeur de l'argument et y, 
la valeur correspondante de la 
ne | A | fonction. 
Les points (x;, y:) sont portés 
: | Zn sur un graphique (fig. 14.8.5). 
Des considérations théoriques 
ou autres ont permis de détermi- 
ner la forme de la relation y — @ (x). La fonction y = œ (x) contient 
plusieurs paramètres numériques a, b, c, ... Ces paramètres doi- 
vent être choisis de telle sorte que la courbe exprime le mieux, en un 
certain sens, la relation obtenue expérimentalement. 


? Yn 
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Comme dans tout problème de lissage il y a lieu d'établir tout 
d’abord ce que nous considérerons être la meilleure solution. Par 
exemple, on peut considérer la meilleure la solution assurant le 
minimum des écarts entre la courbe approchée et des points cxperi- 
mentaux ou bien on peut exiger que soit minimale la somme des 
valeurs absolues des écarts entre les points et la courbe, etc. Pour 
chacune de ces exigences on obtient une solution particulière du pro- 
blème et certaines valeurs des paramètres a, b, c ... (Cependant, 
la plus employée pour la solution de ces problèmes est la méthode 
des moindres carrés, qui consiste à rendre minimale la somme des carrés 
des écarts entre les points 
expérimentaux et la courbe 
de lissage. La méthode des 
moindres carrés présente 
par rapport aux autres mé- 
thodes de lissage d'avantages 
importants: premièrement, 
elle permet une détermina- 
tion des paramètres «a, b, 
C, ... assez simple, de 
plus elle repose sur un fon- 
dement théorique probabi- 
liste sérieux. 

Examinons un peu plus Fig. 14.8.5 
près ce fondement. Soit 
y = p (zx) l'expression exacte de la relation réelle existant entre y 
et z. Les points expérimentaux s'écartent de cette relation par suite 
des erreurs inévitables de mesure. Nous avons déjà mentionné que 
les erreurs de mesure suivent généralement la loi normale. Supposons 
qu'il en soit ainsi. Considérons une valeur quelconque x, de l’argu- 
ment. Le résultat de l'expérience est la variable aléatoire Y'; répar- 
tie suivant une loi normale d'espérance mathématique o (r;) et 
d'écart quadratique moyen 0o;, ce dernier caractérisant l'erreur de 
mesure. Supposons que l'erreur de mesure soit la même en tous les 
points : 


Gi = 02 = :.4 = 0, = 0: 
La loi normale de répartition de la variable Ÿ peut alors s'écrire 
comme suit : 
Cv;-ç(x,)}? 


fi Qi) == e CO (14.8.2) 


Supposons que l'expérience qui est dans notre exemple une série 
de mesures ait réalisé l'événement consistant en ce que les variables 
aléatoires (Y1, 2, ..., ŸY,) ont pris les valeurs (y;, ÿ2, . .- ., Yn).' 
Ï1 y a lieu de choisir les espérances mathématiques œ (x;), @ (x2), ... 


29° 
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..…, p(z) de telle sorte que la probabilité de cet événement soit 
mazimale *). 

En toute rigueur la probabilité de l'un quelconque des événe- 
ments Ÿ; = y;, tout comme celle de leur réalisation simultanée, est 
égale à zéro car les variables Ÿ; sont continues ; c’est pourquoi nous 
allons nous servir non pas de la probabilité des événements Y, = y, 
mais des éléments de probabilité correspondants : 


ñ : [v;-®x;)}3 
dy; = 20% à 8. 
fi (ui) dyi VA dyi (14.8.3) 
Nous allons calculer la probabilité pour que le système de varia- 
bles aléatoires Y,, ŸY , ..., Ÿ, prenne l’ensemble des valeurs se trou- 


vant chacune dans l'intervalle | 
(us, ya + dy) (GG =1,2,...,n). 


Les expériences étant indépendantes, cette probabilité est égale 
au produit des éléments de probabilité (14.8.3) pour tous les i: 


. n 
Il RE nn D hu (14.8.4) 
——— € y:=Ke Le : 8. 
ra o V2?2x 


où X est un coefficient dépendant de ® (zx;). 

I1 y a lieu de choisir les espérances mathématiques (x), 
 (xz2), -.., ®(z,) de telle sorte que l'expression (14.8.4) soit 
maximale. 

La grandeur 


n 
1 

— Zi D Eus-9tx D} 

e ii 


est toujours inférieure à l’unité, donc sa valeur est maximale lorsque 
l'exposant est minimal en valeur absolue : 


_ 2 li —p(x)l= min. 
i=1 


Ceci donne, le facteur constant _ mis à part, la condition impo- 


sée par la méthode des moindres carrés: pour que l’ensemble de va- 
leurs observées 
Yis Y2s + + +1 Un: 


soit Le plus probable il faut choisir la fonction q (x) telle que la somme 
des carrés des écarts des valeurs observées y, par rapport à œ (x;) soit 


*) C'est le principe dit « du maximum de vraisemblance ». 
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minimale : 

n 

D [yi— p (xi)]? = min. 

{=1 


Nous avons ainsi justifié la méthode des moindres carrés, en nous 
basant sur la loi normale des erreurs de mesure et la condition de 
probabilité maximale d’un ensemble donné d'erreurs. 

Passons au calcul des paramètres a, b, c ... partant du prin- 
cipe des moindres carrés. Supposons que l’on ait un tableau de don- 
nées expérimentales (tableau 14.8.1) et que certaines considérations : 
physiques, théoriques ou simplement l'allure de la relation obser- 
vée, aient permis de choisir la forme générale de la fonction y = 
— p (z) dépendant de plusieurs paramètres numériques a,b,c, ... 
Il y a lieu de déterminer ces paramètres à l’aide de la méthode cles 
moindres carrés de telle sorte que la somme des carrés des écarts y; 
par rapport à œ (x;) soit minimale. Ecrivons y comme suit: 


y = @{x; a, b,c, ...) (14.8.5) 
Le choix des paramètres a, b, c, ... est régi par la condition 
D ln: a, be, ...)f= min. (44.8.6) 
=! 


Nous allons trouver les valeurs de a, b, c, ... rendant minimal le 
premier membre de l'expression (14.8.6). A cet effet dérivons-le par 
rapport à a, b, c, et annulons les dérivées : 


S [y:—p(x;a,b,c, ...)] (5), =0. 


ini 
D yi—p(zi: a, b. 6, ...)} (52) =0, (14.8.7) 


iz=i 


D lyi— plz; a, bc, ...)] (5),-0, 


{= 1 


où (#}: == Pa (T1; &, db, c, . . .) est la dérivée partielle de la fonc- 


tion œparrapport au paramètre a au point x, et (+  ) (& 2), 


les dérivées partielles par rapport à b, c, ... 

Le système (14.8.7) contient autant d'équations que d’inconnues 
a, b, c,. 

Le système (14.8.7) ne peut être résolu sous une forme générale ; 
pour cela il faudrait se donner la forme de la fonction ®. 
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Nous allons envisager deux cas que l’on rencontre souvent dans 
la pratique; le cas où y est une fonction linéaire et lorsque c’est un 
polynôme du second degré (parabole). 


1. Choix des paramètres d’une fonction linéaire par la méthode des 
moindres carrés 
L'expérience a fourni l'ensemble des valeurs (x;, ys) (à = 1, 
2, ..., n; fig. 14.8.6). 


ÿy=ax-b 


Æ, |\%Æ2 Hs 
Fig. 14.8.6 
Déterminer par la méthode des moindres carrés les paramètres 
a, bd de la fonction linéaire 


y = az + b, 


représentant la relation expérimentale étudiée. 
Solution:Ona: 


y = q(z; «a, b) = az + b. (14.8.8) 
En dérivant l'expression (14.8.8) par rapport à a et b on a: 


msi (Rss 


“da 
+ =1: (&).=1 


En substituant les résultats dans les formules (14.8.7) on obtient 
deux équations permettant de calculer a et b: 


2} [yi— (az: + b)] zi =0 ; 
{mi 


» UT — (ax: + 0)] = 0, 
ET | 
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14.8] 
ou en enlevant les parenthèses et réalisant la sommation 
n n n 
SO ziÿi— a D zi —b D zi=0, 
: u Fi (14.8.9) 


Syria D zi—bn=0. 
im {== 1 


Divisons les deux équations (14.8.9) par n: 


D ZiYi D zi ÿ 
i=1 _a = —b = =0, 


: (14.8.10) 


Su DE] 


gb — 0. 
n 


Les sommes entrant dans l'équation (14.8.10) ne sont rien d'autre 
que les moments statistiques : 


2, DE: 


°. im _n® : 


n 
D S sui 
= me; ei — = of,1lX, YI. 


En substituant ces équations dans le système (14.8.10) on obtient: 
ai X,Y — aœ X —bD = 0, 
1,1 . al ]— 0mx | (14.8.11) 
my, — amz —b=0. 
En tirant b de la seconde équation (14.8.11) et en le substituant dans 


la première on a: 
b=m;,—am; 


ai,1[X, Y]—au3{X]—(m; —ami)ms —0. 


Résolvons cette dernière équation par rapport à a: 
& X, Y1— m°m® 
PELLE om (14.8.12) 


ag (X]—(m£)? 
L'expression (14.8.12) peut être simplifiée par l'introduction des 
moments centrés au lieu des moments initiaux. En effet : 
af,11X, Y]—msm, = Ki, 
az [X]— (m2) =D;, 
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Key è - 
= Ds : b—m,;—am;, (14.8.13) 


avec 


—” 


Mz — à » My Fa , 
__ 2 (1m (yi—m}) | (44.8.14) 
XV n + 
Ÿ (z1—m£) 
De — 


Nous avons résolu le problème posé et trouvé la relation linéaire 
entre y et x sous la forme: 


Kay 


D* ms 


Ep me 
#T Ds Fr 
où en transportant m’ dans le premier membre : 
s 
y—m = (x — m2). (14.8.15) 


Nous avons exprime les coefficients de la relation linéaire en fonc- 
tion des moments centrés et non des moments initiaux, seulement 
parce que sous cette forme les formules sont plus simples. Dans les 
applications pratiques il peut s'avérer plus commode de calculer 

zy et D£ non pas par les formules (14.8.14) mais en fonction des 
moments initiaux d'ordre 2: 


(14.8.16) 


Da (map, 


Pour que les formules (14.8.16) ne conduisent pas à des différences 
de nombres voisins, il y a lieu de reporter l’origine en un point pas 
trop éloigné des espérances mathématiques m%, mÿ. 
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2. Calcul des paramètres d'une parabole du second degré 
par la méthode des moindres carrés 


L'expérience a fourni l’ensemble des valeurs (z;, y:) (i = 1, 2, ... 
n; fig. 14.8.7). Trouver par la méthode des moindres carrés 


y eo. _y=ax*+bxec 


Fig. 14.8.7 


les paramètres d’une fonction quadratique (parabole du second degré) 


de la forme : 
y=a +br+e 


correspondant à la relation observée expérimentalement. On a: 
= pr; a b,)=a# +br+e, 


0 __2 (& 2 
œ 7 ? æ) ri 
0m _ 0p\ 
“D (> ,— 4 
2e _1 (< —4 

c d dc 5 


En substituant les résultats ci-dessus dans l’équation (14.8.7) 
on obtient: 


2 [ÿs — (ext + bz, +- c)] x = 0, 
2 [ye— (axzi + br, +-c)]r; =0, 


2 (y: — (art + br; + c)] =0, 
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ou après transformations! 


2 rÂy | zi DE: 
= a = b i=1 ce = 0, 
n n n 
n n n n 
3 2 
Zii Zi Zi z 
À op à es ï (44.8.17) 
n n d 


—c—=0. 
n n n } 


Les coefficients de ce système sont également les moments statis- 
tiques du couple X, Y: 


n 
> z DIET 


imi ii 


Ÿ 2 Ÿ Ÿ 


ma lXls nait noix); 


DE DIET 
= — = a,1[X, Y]; = — = a, 1 [X, Y]. 


En utilisant ces expressions on peut écrire le système d'équations 
(14.8.7) sous une forme assez simple. En effet, compte tenu de ce que 
ag [X] =1; a*o1[X, Y]— a? [Ÿ] et transférant les termes ne 
contenant pas d’inconnues dans les seconds membres on obtient : 


at{X]a+a$[XJb+a$[X]e=a8, 11X, Y], 
aÿ[X]e-+ai[X]b+at[Xjc=at.11X, Y], ?  (14.8.18) 
ai[X]a+at(X]b+as[X]c= a. 1[X, Y]. 


Il est facile de trouver la loi donnant les coefficients dans les équa- 
tions (14.8.18) : le premier membre contient dans l’ordre décroissant 
seuls les moments de la variable X, le second membre représente les 
moments du couple (X, Y}, de plus, les moments en X vont en ordre 
décroissant d'une équation à l’autre, et ceux en Ÿ sont toujours du 
premier ordre *). 


*) La solution du système (14.8.18) par an d'os aux inconnues a, b, c 
n'est pas donnée ici sous une forme générale, celle-ci étant trop compliquée; 
en pratique on ne se sert pas en général de la méthode des déterminants, mais 
on procède par exclusion successive des inconnues. 
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Les coefficients d’une parabole d'ordre quelconque seront donnés 
par des équations semblables. 

On voit que dans le cas où une relation expérimentale est lissée 
d’après la méthode des moindres carrés par un polynôme d'ordre 
quelconque, les coefficients de ce polynôme sont les solutions d’un 
système d'équations linéaires. Les coefficients de ce système d’équa- 
tions linéaires sont les moments statistiques d'ordre quelconque, 
caractérisant le système de grandeurs (X, Ÿ), celui-ci étant considéré 
comme un système de variables aléatoires. 

La solution du problème du lissage d'une relation expérimentale 
par la méthode des moindres carrés est presque aussi simple 
lorsque la fonction de lissage est non pas un A mais une 
somme de fonctions arbitraires données q1 (x), @2 (x), . . ., @x (x) 
avec les coefficients &, a, . .., @&: 


Y—P(Z; @, Ga -.., an) = GPa (x) -+ GP (x) + . + axpa (x) = 
h 
— pa a;p;(z) (14.8.19) 


et qu'il y a lieu de trouver les coefficients a;. 
Par exemple, on peut employer à cette fin un polynôme trigo- 
nométrique : 


DZ; &, G2, 3, &) = & cos wz + a, sin wz + a; cos 2067 + 
+ a, sin 207 
ou une combinaison linéaire de fonctions exponentielles : 
PT; @i, Gr, A3) = aiett + aeft + asev', etc. 
Dans le cas où la fonction est donnée par une expression du type 


(14.8.19), les coefficients &, az, . .., a, sont les solutions d'un 
système de À équations linéaires du type: 


2 (ya — [@sPs (x1) + G2Pa (xs) + + + GnPa (zs)]} Pa (x1) = 0, 


2 {ya — Laipi (Zi) + G2Pa (1) + + + ana (x1)]} Pa (z:) = 0, 


2 UL — [ass (25) + G2Pa (2e) +... + Gran (zs)]} Pa (z1) = 0. 
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En prenant la somme terme à terme on a: 
au À) Leu (FOI + ga À qu(z) @ù D + + 
+ ax a Pa (T1) Pa (21) =ÿ yiPs (21). 
au À qu (21) qe (ei) + ae D Iqa (+ + 


+ 4 2 Pa (Z1) P2 (ti) = À YiP2 (z1), 


a; 2 Pi (Ti) Pa (Ti) +@ 2 Pa (Zi) Pa (Ti) +... + 


+ ak D [x (x:)}° = 2 YiPn (Ti), 


ou sous une forme plus compacte: 


R n n 
À a; 2 Pi (Zi) Ps (xi) = 2 yiPa (Zi), | 
R 


20,2 pr)qe)= Luigi), | (14.8.20) 


R nñn n 
À a; à Pa (71) Ps (xi) = À YiPa (Ti): 


On peut toujours résoudre le système a io (14.8.20) et 
trouver ainsi les coefficients æ&, az, .. 

Le problème du lissage par la Méthode ‘des moindres carrés de- 
vient beaucoup plus compliqué lorsque l'expression de la fonction 
y = (zx; a, b, c, ...) n’est pas linéaire par rapport aux coeffi- 
cients numériques a, b, c, ... Dans ce cas’ les calculs deviennent 
très vite inextricables. Cependant même dans ce cas souvent on arri- 
ve à obtenir la solution du problème d'une manière assez simple. 

Nous allons illustrer l’idée fondamentale des procédés employés 
sur l'exemple le plus simple où la fonction comporte un seul para- 
mètre non linéaire a (par exemple y = e-"* ou y = sin az ou encore 

— {/ax). Sous la forme générale: 
y = (x, a), (14.8.21) 


a est le paramètre qu'il y a lieu de choisir par la méthode des moindres 
carrés pour un meilleur lissage de la relation expérimentale montrée 
sur la figure 14.8.8. 
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Nous allons résoudre ce problème de la manière suivante. Soit un 
certain nombre de valeurs du paramètre a, pour chacune desquelles 
nous allons trouver la somme des carrés des écarts y; — q (x, à), 
qui est une certaine fonction de a et que nous désignerons par Z (a): 


Z (a) 2 [ys— p (xi, a)}°. 
Construisons la courbe Z (a) (fig. 14.8.9). 


Fig. 14.8.8 Fig. 14.8.9 


La valeur de a pour laquelle la courbe Z (a) a un minimum est 
adoptée pour valeur convenable du paramètre a dans l'expression 
(14.8.21). 

On peut en principe d’une manière analogue, sans résoudre les 
équations (14.8.7), choisir conjointement deux paramètres (a, b) 


Fig. 14.8.10 


satisfaisant au principe _des moindres carrés; le problème ne s’en 
trouve que peu compliqué et revient au tracé non pas d’un seul, mais 
de plusieurs graphiques (fig. 14.8.10) ; il y aura lieu alors de chercher 


350 TRAITEMENT DES RÉSULTATS DES EXPÉRIENCES (CH. 14 


l’ensemble des valeurs a, b, donnant le minimum absolu à la somme 
des carrés des écarts Z (a, b). 


Exem g 1e 1. Dans une expérience on étudie la relation entre la profon- 
deur de pénétration À d’un corps dans un obstacle et l'énergie spécifique $ 


100 200 300 

Fig. 14.8.11 
(énergie par un cm carré de surface d'impact). Les données expérimentales 
sont consignées au tableau 14.8.2 et représentées graphiquement (fig. 148.11). 
Tableau 14.82 


h 
de 
$:, kgm/cm3 


hs ; 
2 | i 4 remvens 


1 41 4 8 180 23 
2 90 8 9 208 26 
3 81 10 10 241 30 
4 104 14 11 250 31 
5) 120 16 12 269 36 
6 139 13 301 37 
7 154 19 


Trouver et construire par la méthode des moindres carrés la droite donnant 
la relation entre À et €. 
Solution. On a 


$: h; 
28 PS DRE 
MS 13 13 9 CRT 43 — 13 


Pour le traitement à l'aide des moments initiaux transportons l'origine 
des coordonnées dans un point voisin de la moyenne: 


$o = 150; ho = 20. 


= 21,1. 
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Dressons un nouveau tableau pour les valeurs des grandeurs: 
É'=8—%$0; h'—h—ho 
(tableau 14.8.3). 
Tableau 14.8.3 


i Laisse | hj=h,- 20 | 4 | si 150 | hj=mh,— 20 


Calculons les moments: 
>: 6 
a? [81= 5 6869 ; 
D = 6869 — (m%e,)? = 6869 — (164,4 — 150)? — 6662 ; 


D») 8h 
a? 116’, h’]=— : 5 = 84 : 
Kg, = ia [6’, h']— mm? = 842 — (164,4 — 150) (21,1— 20) = 842 — 16 — 826. 


L'équation cherchée de la droite est: 


$ 
h—mi= pe (6m) 


ou 
h — 21,1 — 1,124 (8 — 164,4). (14.8.22) 


La droite (14.8.22) est représentée sur la figure 14.8.11. 
Exemple 2. Un condensateur chargé à une tension de Us = 100 volts 
se décharge sur une résistance. On mesure la tension U entre les armatures 
du condensateur toutes les secondes pendant un intervalle de temps de 10 se- 
condes. La tension est mesurée à 5 volts près. Les résultats des mesures sont 
donnés dans le tableau 14.8.4. 
Tableau 14.8.4 


| US 


U;, V 


i | Li, 8 U;,, V 


1 0 100 7 6 19 
2 1 79 8 7 10 
3 2 99 9 8 10 
à 3 40 10 9 d 
d 4 30 11 10 6) 
6 20 


700 


100 


U(t) 


£ (&) 


G 25 OGS0 a =0,307 
Fig. 14.8.12 


5 
Fig. 14.8.13 
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Théoriquement, la tension en fonction du temps est: 
U—=Ue"!. 


A partir des données expérimentales choisir par la méthode des moindres 
carrés la valeur du paramètre «. 


Solution. Dans les tables de la fonction ex on trouve que ex est 
environ 0,05 pour z = 3; par conséquent, le coefficient & doit être de l’ordre 
de 0,3. On se donne plusieurs valeurs de & voisines de 0,3: 


a = 0,28; 0,29; 0,30; 0,31; 0,32; 0,33 
et on calcule les valeurs correspondantes de la fonction: 
U=U,e 


aux points !, (tableau 14.8.5). Dans la dernière ligne du tableau 14.8.6 on trouve 
les valeurs des sommes des carrés des écarts Z (œ) en fonction de «. 


Tableau 14.8.5 


i ts &œ=0,28 | &@=:0,29 | a==0,30l| a=0,31)] &==0,32| &=0,33 
1 0 100,0 100,0 100,0 100,0 100,0 100,0 
2 1 75,5 74,8 74,1 73,3 72,6 71,9 
3 2 57,1 56,0 54,9 53,8 92,7 51,7 
4 3 43,2 41,9 40,7 39,5 38,3 37,2 
5 4 32,6 31,3 30,1 28,9 27,8 26,7 
6 5 24,6 23,5 22,3 21,2 20,2 19,2 
7 6 18,6 17,6 16,5 15,6 14,7 13,8 
8 7 14,1 13,1 12,2 11,4 10,6 9,9 
9 8 10,7 9,8 9,1 8,4 7,7 7,1 
10 9 8,0 7,4 6,7 6,1 9,6 9,1 
11 10 6,1 9,9 9,0 4,9 4,1 3,7 
| Z (a) 83,3 | 40,3 17,4 | 13,6 | 25,7 51,4 


La figure 14.8.12 montre la courbe de la fonction Z (æ). On voit que le 
minimum est atteint à &« = 0,307. Ainsi, la méthode des moindres carrés fournit 
en tant que la meilleure approximation des données expérimentales la fonction 
U = Uoe2.3%071, Sur la figure 14.8.13 on trouvera le graphique de cette fonction 
ainsi que les données expérimentales. 
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CHAPITRE 15 


NOTIONS DE BASE DE LA THÉORIE 
DES FONCTIONS ALÉATOIRES 


15.1. Notion de fonction aléatoire 


Dans notre cours de théorie des probabilités, nous avons jusqu’à 
présent étudié des variables aléatoires. Dans une expérience 
une variable aléatoire prend une certaine valeur unique, bien 
qu'’inconnue d'avance. Par exemple: abscisse d’un coup au tir; 
erreur d'un radiotélémètre lors d’une seule mesure de la distance, etc. 

En nous limitant à l'étude de telles variables aléatoires, nous 
avons vu les phénomènes aléatoires d’une manière statique, dans les 
conditions constantes d’une seule expérience. 

Cette méthode élémentaire est souvent insuffisante pour la réso- 
lution de problèmes pratiques. Souvent on a affaire à des grandeurs 
aléatoires variant d’une manière continue durant l'expérience. 
A titre d'exemple, on peut citer l’erreur d’un radiotélémètre lors de 
la mesure continue d’une distance variable. 

De telles grandeurs aléatoires variant durant l'expérience, à la 
différence des variables aléatoires ordinaires, sont appelées fonctions 
aléatoires. 

La théorie des fonctions aléatoires (ou théorie des processus aléa- 
toires ou stochastiques) a pour objet l'étude de tels phénomènes 
aléatoires. Cette science peut, d'une manière imagée, être appelée 
« dynamique des variables aléatoires ». 

La théorie des fonctions aléatoires est une nouvelle branche de la 
théorie des probabilités qui est en voie de développement depuis 
quelque 30 ans. A l'heure actuelle cette théorie continue à se déve- 
lopper et à s'enrichir très rapidement. Les causes en sont dans 
les exigences techniques modernes. En effet ces derniers temps on 
a vu un développement intense des systèmes de commande automati- 
que. Ainsi, les exigences imposées à la base théorique de la commande 
automatique deviennent ainsi de plus en plus sérieuses. Le développe- 
ment de cette théorie est impossible sans l’analyse des erreurs accom- 
pagnant inévitablement les processus de commande se déroulant 
toujours sous l’action de perturbations aléatoires (appelées « bruits »). 
Ces perturbations sont de par leur nature des fonctions aléatoires. 
Pour choisir d'une manière rationnelle les paramètres des systèmes 
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de commande, il y a lieu d’étudier leur réaction à l’action continue de 
perturbations aléatoires, or, l'unique outil efficace et pratique est la 
théorie des fonctions aléatoires. 

Dans le présent chapitre nous allons étudier les notions fondamen- 
tales de cette théorie et la manière dont se posent dans la pratique 
les problèmes exigeant l’utilisation de la théorie des fonctions aléa- 
toires. De plus, nous exposerons ici les règles générales permettant 
d'utiliser les caractéristiques des fonctions aléatoires analogues 
à celles qui ont été formulées à propos des caractéristiques numé- 
riques des variables aléatoires ordinaires. 

La première notion fondamentale que nous rencontrerons, c'est 
celle de fonction aléatoire. Cette notion est autant plus étendue et 
riche que celle de variable aléatoire que le sont les notions de 
variable et de fonction comparées à la notion de grandeur constante. 

Revenons à la définition de la variable aléatoire. On appelle 
variable aléatoire une grandeur pouvant dans l'expérience prendre 
une valeur quelconque inconnue à l'avance. D'une manière analogue 
nous allons définir une fonction aléatoire. 

Une fonction aléatoire est une fonction pouvant dans l'expérience 
adopter une forme quelconque inconnue d'avance. 

La forme prise par une fonction aléatoire lors d'une expérience 
est appelée réalisation de cette fonction aléatoire. Si on effectue une 
série d'expériences sur une fonction aléatoire, on obtient une famille 
de réalisations de cette fonction. 

Nous allons donner plusieurs exemples de fonctions aléatoires. 

Exemple 1. Théoriquement la tension U du réseau est cons- 
tante et égale à 220 V. En fait la tension oscille tout le temps autour 
de la valeur nominale U, — 220 V et se trouve être une fonction aléa- 
toire du temps: Ü (4). La mesure de cette tension durant un certain 
laps de temps + est une expérience conduisant à une certaine forme 
(réalisation) de la fonction aléatoire U (t) (voir fig. 15.1.1). 

Si l’on trace automatiquement à l’aide d'un appareil enregistreur 
la courbe U ({) et que l’on effectue une série d'expériences (dont cha- 
cune dure t), dans chaque expérience l'appareil enregistrera une nou- 
velle réalisation de la fonction aléatoire U (t); la série d'expériences 
donnera une famille de réalisations (fig. 15.1.2). 

Exemple 2. La température de l’air T ({) mesurée durant 
une journée est une fonction aléatoire du temps {. En enregistrant 
les valeurs de la température pour différents jours d’une même 
saison en fonction du temps on obtient une famille de réalisations 
de cette fonction aléatoire (fig. 15.1.3). 

Exemple 3. Un radar au sol guide un avion jusqu'à une alti- 
tude égale à k. Le processus d'ascension est une fonction aléatoire 
H (t). L'enregistrement répété des variations de l'altitude à l’aide 
d'un appareil donne une famille de réalisations de la fonction aléatoi- 
re À (t) (fig. 15.1.4). 
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Fig. 15.1.1 


Fig. 15.1.2 


Fig. 15.1.3 


Fig. 15.1.4 
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La liste des exemples de fonctions aléatoires que l’on rencontre 
dans les applications techniques est sans fin. En effet, chaque fois 
que nous avons affaire à un système travaillant d’une manière con- 
tinue (système de mesure, de commande, de guidage, de régulation), 
lors de l’analyse de sa précision de fonctionnement il y lieu de tenir 
compte d'actions aléatoires (bruits). Tant les bruits que les réactions 
produites par ceux-ci sont des fonctions aléatoires du temps. 

Jusqu'à présent nous n'avons parlé que des fonctions aléatoires 
dont l'argument est le temps £. Dans la pratique on rencontre bien 
des fonctions aléatoires dépendant non pas du temps mais d’autres 


Fig. 15.1.5 


arguments. Par exemple, les caractéristiques de résistance d’une 
barre hétérogène peuvent être considérées comme des fonctions aléa- 
toires de l’abscisse x de la section. La température de l'air dans les 
différentes couches de l'atmosphère peut être considérée comme une 
fonction aléatoire de l'altitude X. 

Dans la pratique on rencontre également des fonctions aléatoires 
dépendant non pas d’un seul, mais de plusieurs arguments. Par exem- 
.ple, les données aérologiques caractérisant l’état de l'atmosphère 
(température, pression, vent) sont dans le cas général des fonctions 
aléatoires de quatre arguments: de trois coordonnées zx, y, z et du 
temps fé. 

Dans ce cours nous n’étudierons que des fonctions aléataires d'un 
seul argument. Comme le plus souvent cet argument est le temps, nous 
le désignerons par la lettre f{. De plus, nous convenons de désigner 
les fonctions aléatoires par des lettres majuscules {X (1), Y (t), . . .] 
pour les distinguer des fonctions non aléatoires que nous désignerons 
par des minuscules: {x (t), y (t), . ..]. 

Soit une certaine fonction aléatoire X (f). Supposons qu’elle ait 
été soumise à »r expériences indépendantes ayant donné r réalisations 
Zi (8), z2 (t), - . ., zh (t) (fig. 15.1.5), l'indice désignant le numéro 
de l'expérience. 


358 NOTIONS DE BASE DE LA THÉORIE DES FONCTIONS ALÉATOIRES [CH. 15 


Evidemment chaque réalisation aléatoire de la fonction aléatoire 
X (1) est une fonction non aléatoire. 

Fixons maintenant une certaine valeur de l’argument t et voyons 
ce que devient la fonction aléatoire X (+). Il est clair qu’elle devien- 
dra une variable aléatoire au sens habituel de ce terme. Nous appelons 
cette variable aléatoire section de la fonction aléatoire correspondant 


à { donné. Si l’on considère la section d’une famille de réalisations 
à t donne (fig. 15.1.5), on obtient nr valeurs prises par la variable 
aléatoire X (f) dans nr expériences. 

Nous voyons qu'une fonction aléatoire possède en même temps 
les propriétés d'une variable aléatoire et d'une fonction. Si l’on 
fixe la valeur de l'argument, elle devient une variable aléatoire habi- 
tuelle ; chaque expérience en fournit une réalisation qui est une fonc- 
tion ordinaire (non aléatoire). 

Dans l'exposé ultérieur nous envisagerons une même fonction 
X (t) tantôt comme une fonction aléatoire, tantôt comme une varia- 
ble aléatoire, suivant qu'elle est considérée sur toute la gamme de 
variation de t ou pour une deses valeurs. 


15.2. Notion de fonction aléatoire en tant que 
généralisation de la notion de système de variables 
aléatoires. Loi de répartition d'une fonction aléatoire 


Considérons une fonction aléatoire X ({) sur un certain intervalle 
de temps (fig. 15.2.1). 

En toute rigueur, on ne peut pas représenter une fonction aléatoire 
par un graphique ; on ne peut figurer qu’une de ses réalisations. Ce- 
pendant d’une manière toute conventionnelle on peut dessiner la 
fonction aléatoire X ({) comme une courbe, celle-ci étant non pas une 
réalisation mais tout l’ensemble des réalisations possibles de X (4). 
Pour noter qu'il s’agit d’une courbe conventionnelle nous la repré- 
senterons en pointillé. 
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Supposons que les variations d’une fonction aléatoire soient enre- 
gistrées à l’aide d’un appareil et ceci non pas d'une manière continue 
mais à des instants fi, te, . . ., Ln- 

Comme nous l'avons déjà noté, pour une valeur donnée de t# 
la fonction aléatoire devient une variable aléatoire ordinaire. Par 
conséquent, les résultats de l’enregistrement forment un système de 
m variables aléatoires : 


X (4), X(b),... X (4). (15.2.1) 


Il est évident que l’enregistrement d'une fonction aléatoire à des 
intervalles de temps suffisamment rapprochés donne une image 
assez précise de ses variations. Ainsi, l'étude d'une fonction aléa- 
toire peut à une certaine approximation être ramenée à celle d'un 
système de variables aléatoires (15.2.1). Au fur et à mesure que m 
augmente, cette approximation devient de plus en plus précise. A 
la limite le nombre de valeurs de l’argument et par conséquent celui 
de variables aléatoires (15.2.1) devient infini. Aussi la notion de fonc- 
tion aléatoire peut-elle être considérée comme la généralisation natu- 
relle de la notion de système des variables aléatoires au cas d’un en- 
semble infini (innombrable) de variables aléatoires formant un sys- 
tème. 

En partant de cette interprétation de la fonction aléatoire, propo- 
sons-nous de répondre à la question suivante: qu'entend-oa par la 
loi de répartition d'une fonction aléatoire? 

On sait que la loi de répartition d’une variable aléatoire est une 
fonction d’un seul argument, celle d'un système de deux variables 
une fonction de deux arguments, etc. Cependant, l’utilisation prati- 
que de fonctions d'arguments multiples en qualité de caractéristi- 
ques probabilistes est si peu commode que même pour un système 
de trois ou quatre variables on abandonne ces lois de répartition 
pour ne se servir que des caractéristiques numériques. Quant à la 
loi de répartition de la variable aléatoire, fonction d’un nombre 
infini d'arguments, dans le meilleur des cas on ne peut que lui don- 
ner formellement une forme symbolique quelconque, l’utilisation 
pratique de cette caractéristique étant évidemment impossible. 

Néanmoins, on peut trouver pour une fonction aléatoire certai- 
nes caractéristiques probabilistes analogues aux lois de répartition. 
Précisons notre idée. 

Considérons la variable aléatoire X (t) qui est la section d’une 
fonction aléatoire à l'instant £ (fig 15.2.2). Cette variable aléatoire 
possède une loi de répartition qui dépend évidemment, dans le cas 
général, de {. Désignons-la par f (x, t); cette fonction est appelée 
loi de répartition unidimensionnelle de la fonction aléatoire X (4). 

Evidemment, la fonction f (x, t) n’est pas une caractéristique 
exhaustive de X (t). En effet, elle ne donne que la loi de répartition 
de X ({) pour une valeur fixée, bien qu'arbitraire de t, et ne montre 
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pas comment les variables aléatoires X ({) varient pour différents 
t. La loi de répartition bidimensionnelle 


f(&i 225 4, te) (15.2.2) 


représente une caractéristique plus complète de la fonction aléatoire 
X (1). C'est la loi de répartition d’un système de deux variables aléa- 
toires X (4), À (f2), c’est-à-dire de deux sections arbitraires de la 
fonction aléatoire X (£). Cependant cette caractéristique n’est pas 
non plus complète; la loi de répartition tridimensionnelle 


f (Tir Las Ts Us fa ts) (15.2.3) 
serait une caractéristique encore plus complète. 


Il est évident que théoriquement on peut augmenter indéfiniment 
le nombre d'arguments pour avoir des caractéristiques de plus en 


Fig. 15.2.2 


plus détaillées et complètes de la fonction aléatoire, mais l’utilisation 
des caractéristiques aussi compliquées, dépendant d’un grand nombre 
d'arguments, est extrêmement difficile. C’est pourquoi dans l’etude 
des lois de répartition des fonctions aléatoires, on se limite généra- 
lement aux cas particuliers où, pour caractériser complètement une 
fonction aléatoire, il suffit, par exemple, de connaître la fonction 
(15.2.2) (processus sans « postaction »). 

Dans notre exposé élémentaire des fonctions aléatoires nous n'uti- 
liserons pas les lois de répartition, en nous bornant aux caractéris- 
tiques simples des fonctions aléatoires, analogues aux caracté- 
ristiques numériques des variables aléatoires. 


15.3. Caractéristiques des fonctions aléatoires 


Maintes fois nous avons eu l’occasion de nous rendre compte du 
rôle important que jouent en théorie des probabilités les caractéris- 
tiques numériques fondamentales des variables aléatoires, à savoir 
l'espérance mathématique et la variance dans le cas d’une seule varia- 
ble aléatoire, l’espérance mathématique et la matrice de corrélation 
pour un système de variables aléatoires. L'art d'utiliser autant que 
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possible les caractéristiques numériques, sans recourir aux lois de 
répartition, se trouve à la base des applications de la throrie des pro- 
babilités. L’appareil des caractéristiques numériques est un outil 
très souple et puissant, permettant de résoudre assez simplement un 
grand nombre de problèmes pratiques. 

Un appareil semblable est utilisé dans la théorie des fonctions 
aléatoires. On introduit pour les fonctions aléatoires des caractéris- 
tiques de base simples, analogues aux caractéristiques numériques 
des variables aléatoires, et l’on en établit le mode d'emploi. Il se 
trouve que cet appareil est suffisant dans de nombreux problèmes pra- 
tiques. 

A la différence des caractéristiques numériques des variables 
aléatoires qui sont certains nombres, les caractéristiques des fonctions 
aléatoires sont dans le cas général des fonctions. 

On définit comme suit l’espérance mathématique de la fonction 
aléatoire X (f). Soit la section de la fonction aléatoire X ({) pour 
t donné. Dans cette section nous avons une variable aléatoire habi- 
tuelle et nous allons en déterminer l'espérance mathématique. Il 
est évident que dans le cas général elle dépend de t: 


m, (0 = M IX (1. (15.3.1) 


Ainsi, l'espérance mathématique d'une fonction aléatoire X (t) 
est une fonction .non aléatoire m. (t) qui, pour toute valeur de l'argu- 
ment t, est égale à l'espérance mathématique de la section correspondante 
de la fonction aléatoire. 

L’espérance mathématique d’une fonction aléatoire est une cer- 
taine fonction moyenne autour de laquelle varient les diverses réali- 
sations de cette fonction aléatoire. 

Sur la figure 15.3.1 on a représenté en trait fin les réalisations 
d’une fonction aléatoire et en trait gras son espérance mathématique. 

On définit d’une manière analogue la variance d’une fonction 
aléatoire. 

On appelle variance d'une fonction aléatoire X (t) une fonction non 
aléatoire D. (t) dont la valeur pour t quelconque est égale à la variance 
de la section correspondante de la fonction aléatoire: 


D, (à = D IX (81. (15.3.2) 


La variance d'une fonction aléatoire caractérise, pour £ fixé, la dis- 
persion des réalisations possibles de la fonction aléatoire par rapport 
à la moyenne, en d'autres termes, montre l'influence du hasard sur 
la fonction aléatoire. 

Il est évident que D, (t) est une fonction non négative. La racine 
carrée de cette fonction, 0 (t), est l’écart quadratique: moyen de la 
fonction aléatoire, soit: 


o(t) = VD, (b. (15.3.3) 


Fig. 15.3.1 
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L'espérance mathématique et la variance sont des caractéristiques 
très importantes d'une fonction aléatoire, cependant elles sont insuf- 
fisantes pour en décrire les particularités essentielles. Pour s'en reu- 
dre compte, considérons deux fonctions aléatoires X, (£) et X2: (t) 
représentées à titre d'exemple par des familles de réalisations 
(fig. 15.3.2 et 15.3.3). 

Les fonctions aléatoires X, (£f) et X> (t) ont des espérances mathé- 
matiques et des variances à peu près identiques, cependant elles 
sont très différentes. La fonction X, (f) (fig. 15.3.2) varie d'une 
manière continue. Si, par exemple. au point { sa valeur dépasse net- 
tement la moyenne, il est très probable qu'au point £” elle aura 
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Fig. 15.3.4 


également une valeur supérieure à la moyenne. Les valeurs de X; (t) 
dépendent les unes des autres pour différents {. Au contraire, Ja fonc- 
tion aléatoire X2: ({) (fig. 15.3.3) a un caractère oscillatoire très 
net, les oscillations étant irrégulières et désordonnées. Une telle fonc- 
tion aléatoire est caractérisée par un affaiblissement des liens entre 
ses valeurs au fur et à mesure qu'augmente la distance les séparant 
suivant l'axe des f. 

Il est évident que la structure de ces deux processus aléatoires est 
tout à fait différente, mais cette différence n'apparaît ni dans l’espé- 
rance mathématique ni dans la variance ; ainsi, il y a lieu d'introduire 
une caractéristique spéciale pour décrire une fonction aléatoire. Cette 
caractéristique est appelée fonction de corrélation (ou fonction d’'auto- 
corrélation). La fonction de corrélation caractérise le degré de déepen- 
dance entre les sections d’une fonction aléatoire pour differentes va- 
leurs de ft. 

Soit la fonction aléatoire X (t) (fig. 15.3.4); considérons deux de 
ses sections pour deux instants différents £# et £”, c’est-à-dire les deux 
variables aléatoires X (£) et X (£”). Il est évident que pour des instants 
voisins { et £’ les variables X (t) et X ({’) sont ctroitement lices entre 
elles ; si la variable X (4) a pris une certaine valeur, X ({’) prendra 
avec une grande probabilité une valeur voisine. Il est également cvi- 
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dent qu’au fur et à mesure de l'augmentation de l'intervalle entre les 
sections £ et £” le lien entre X (f) et X (£’) doit en général s’affaiblir. 

Le degré d’interdépendance des variables X (f) et X (f’) peut 
être, en une grande mesure, caractérisé par leur covariance ; naturel- 
lement cette dernière est une fonction des deux arguments t et t’. 
Cette fonction est appelée fonction de corrélation. 

Ainsi, on appelle fonction de corrélation de la fonction aléatoire 
À (t) une fonction non aléatoire de deux arguments K, (t, t”) qui pour 
tout couple de valeurs t, t’ est égale à la covariance des sections correspon- 
dantes de la fonction aléatoire: 


K,(e,t)=MIX (+) X (')], (15.3.4) 


X(D=X()—m,(@0, X(#)=X(#)—m, (1). 


Revenons aux fonctions aléatoires X, (f) et X: (4) (fig. 15.3.2 
et 15.3.3). Nous voyons que bien que leurs espérances mathématiques 
et variances soient à peu près les mêmes, leurs fonctions de corréla- 
tion sont très différentes. Celle de X, (t) décroît lentement avec l’aug- 
mentation de l'intervalle (f, £{’); au contraire la fonction de corré- 
lation de X, (t) décroît rapidement au fur et à mesure qu'’augmente 
cet intervalle. 

Voyons ce que devient la fonction de corrélation KX, (4, t’) 
lorsque ses arguments se confondent. Posant t = {’, on a: 


Ka(E, t)= M I(X (4))°1= D; (6), . (15.3.5) 


c’est-à-dire que pour {’= t la fonction de corrélation devient la variance 
de la fonction aléatoire. 

Ainsi, la variance d’une fonction aléatoire en tant que sa caracté- 
ristique n'est d'aucune utilité; les caractéristiques fondamentales 
d’une fonction aléatoire sont donc l'espérance mathématique et la 
fonction de corrélation. 

La covariance de deux variables aléatoires X (f) et X (f’) ne dé- 
pendant pas de leur ordre de présentation, la fonction de corrélation 
est symétrique par rapport à ses arguments, c'est-à-dire qu'elle ne 
change pas lorsqu'on intervertit les arguments: 


K,(t,t)=Ka(t',t). (15.3.6) 


Si l’on represente la fonction de corrélation ÆX, (4, t”’) sous la for- 
me d’une surface, celle-ci sera symétrique par rapport au plan verti- 
cal Q passant par la bissectrice de l'angle tO{" (fig. 15.3.5). 

Il est à noter que les propriétés des fonctions de corrélation décou- 
lent naturellement de celles de la matrice de corrélation du système 
de variables aléatoires. En effet, remplaçons approximativement la 
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fonction aléatoire X (f) par un système de m variables aléatoires 
X (4), X (t2), ..., X (t,). Avec l’augmentation de m et la diminu- 
tion respective des intervalles entre les arguments, la matrice de cor- 
rélation du système, représentant une table à deux entrées, devient 
à la limite une fonction de deux arguments continüment variables 
ayant des propriétés analogues. La symétrie de la matrice de corré- 
lation par rapport à la diagonale principale entraîne la symétrie de la 
fonction de corrélation (15.3.6). 
Dans la diagonale principale de 
la matrice de corrélation on trou- 
ve les variances des variables 
aléatoires; d’une manière analo- 
gue pour £{ — {’ la fonction de 
corrélation Æ,(t, t’) devient la 
variance D, (t). 

En pratique lorsqu'on a besoin 
de construire la fonction de corré- 
lation de la fonction aléatoire 
X (t), on procède généralement 
comme suit: on se donne plu- 
sieurs valeurs d’argument équidis- 
tantes et l’on détermine la matrice 
de corrélation pour ce système de 
variables aléatoires. Cette matrice 
n’est rien d'autre que la table des valeurs de la fonction de cor- 
rélation pour un réseau rectangulaire de valeurs des arguments dans 
le plan (£, £’). Puis par interpolation ou par approximation on peut 
déterminer la fonction de deux arguments K, (£, £). 

À la place de la fonction de corrélation Æ, (t, £{”) on peut utiliser 
la fonction de corrélation normée: 


nn __ Kxtt,t”) 

Tr (é, l ) = Or (t) Or (4°) , (15.3.7) 
qui est le coefficient de corrélation des variables X (£), X ({’). La 
fonction de corrélation normée est analogue à la matrice de correla- 
tion normée d'un système de variables aléatoires. Pour { = !{” 
la fonction de corrélation normée est égale à l'unité : 


Fig. 15.3.5 


DS [ox ()12 [ox GC) > (08) 

Examinons quel effet produisent sur les caractéristiques fonda- 
mentales d'une fonction aléatoire des opérations élémentaires, 
à savoir, l'addition d'un terme non aléatoire et la multiplication par 
un facteur non aléatoire. Ces termes et facteurs non aléatoires peuvent 
être tant des grandeurs constantes que, dans le cas général, des fonc- 
tions de £. 


366 NOTIONS DE BASE DE LA THÉORIE DES FONCTIONS ALÉATOIRES [CH. 15 


Ajoutons à la fonction aléatoire X ({) le terme non aléatoire ® (t). 
On trouve ainsi la nouvelle fonction aléatoire : 


Y (= X (8) + (6). (15.3.9) 
En vertu du théorème d'addition des espérances mathématiques : 
my (1) = mA (1) + e (0, (15.3.10) 


ainsi lorsqu'on ajoute à une fonction aléatoire un terme non aléatoire, ce 
même terme non aléatoire doit être ajouté à l'espérance mathématique de 
la fonction aléatoire. 

Calculons la fonction de corrélation de la fonction aléatoire 
Y (1): 


Kit) = MY (D Ÿ ()= ALI (0 —m, (0) (3 ()—m, (E')1= 
== M IX (8) -i- pe) — ms (#) — p (0)) (X (++ p (€) — 
mm, (0) — (= MIX (Om (0) (Km (I =Ke (el). 
(15.23.11) 
Ainsi, lorsqu'on ajoute un terme certain à une fonction aléatoire, la fonc- 


tion de corrélation de cette fonction aléatoire ne s’en trouve pas changée. 
Multiplions la fonction aléatoire X (f) par une fonction certaine 


(2): 
Y (= (0) X (t). (15.3.12) 


En faisant sortir la grandeur non aléatoire y (t) du signe de l'espé- 
rance mathématique on a: 


m,( = Mle( X (1 = (tm, (0, (15.3.13) 


c'est-à-dire que si on multiplie une fonction aléatoire par un facteur 
certain, son espérance mathématique se trouve multipliée par ce même 
facteur. 

Calculons la fonction de corrélation: 


Ki, 1)= MIT (D) Y () = M [(Y (0) —m, (0) ( (> — 
—m, (2))] = M [0 pt) (X (4) —m, (0) (X (#°) — 
—m,(e))] = (0) q (7) Ke (e, 4), (15.3.14) 


c'est-à-dire que lorsqu'on multiplie une fonction aléatoire par une fonc- 
tion certaine œ (t), sa fonction de corrélation se trouve multipliée par 
p (4) p (f). 

En particulier, lorsque w (£) == c (const.), la fonction de corré- 
lation se trouve multipliée par c*. 

En utilisant les propriétés décrites ci-dessus des caractéristiques 
des fonctions altatoires, on peut dans un certain nombre de cas sim- 
plifier beaucoup les calculs. En particulier, lorsqu'il y a lieu d'étu- 
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dier la fonction de corrélation ou la variance d'une fonction aléatoire, 
il sera légitime d'envisager la fonction centrée : 


X (}=X(H — m, (à. (15.3.15) 


L’espérance mathématique d’une fonction centrée est identiquement 
nulle, et sa fonction de corrélation est celle de la fonction aléatoire 
X (t): 


K.(4,1)=MIX() X (EC) =Kx (1, #). (15.3.16) 


Dans la suite lorsque nous étudierons des questions liées aux pro- 
priétés corrélationnelles des fonctions aléatoires, nous passerons tou- 
jours aux fonctions centrées correspondantes que nous noterons du 
signe ° placé au-dessus du symbole de la fonction. 

Parfois en plus du centrage des fonctions aléatoires on recourt 
à la normalisation de ces dernières. On appelle fonction normée 
une fonction de la forme: 

X (+) 
X n(t) = TG (15.3.17) 
La fonction de corrélation de la fonction aléatoire normée X, (t) 
est : 
K>x (1, 1") 
Ox (1) x (1°) 


Kz,(t,t')= =r;(t,t'), (15.3.18) 


et sa variance est égale à l'unité. 


15.4. Détermination expérimentale des caractéristiques 
d’une fonction aléatoire 


Supposons que 7 expériences (observations) indépendantes de la 
fonctinn aléatoire X ({) aient donné n réalisations de cette fonction 
(fig. 15.4.1). 

Trouver les estimations des caractéristiques suivantes de la fonc- 
tion aléatoire : de son espérance mathématique m. (t), de sa variance 
D, (t) et de sa fonction de corrélation K, (#, 1’). 

Considérons à cet effet plusieurs sections de la fonction aléatoire 
aux instants 

Li, Lo, ._. nm 


et enregistrons les r valeurs prises par la fonction X (£) à chaque 
instant. 

Généralement les sections #4, £2, ..., t, Sont équidistantes; 
la longueur de l'intervalle les séparant dépend de la forme des courbes 
expérimentales et se choisit de telle sorte qu'il soit possible, d'après 
les points obtenus, de restituer l'allure générale des courbes. Souvent, 
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l'intervalle entre des valeurs voisines de t est donné, indépendam- 
ment du problème traité, par la fréquence de fonctionnement de 


l'appareil enregistreur (par exemple, par la vitesse de la caméra 
employée). 


Fig. 15.4.1 


Les valeurs enregistrées X (t) sont portées dans un tableau dont 
chaque ligne correspond à une certaine réalisation, le nombre de colon- 


nes étant égal au nombre de « repères » de l'argument (tableau 
15.4.1). 


Tableau 15.4.1 


t4 l2 th t 
LU 
zi(t) zilts) zy (+) ... | Zatr) |... | z1 (60) ... | Zi (tm) 
Zz(t) | Z2(ts) | Zate) |... | Zaftr) | +. | za) | - +. | Z2(tm) 
zi00 |ziun ait) || an || mtn |. | zi(tm) 
zntt | salt) | zuGa) |: | san) |... lantn À... | zattm) 


Dans l'i-ème ligne du tableau 15.4.1 on trouve les valeurs de la 
fonction alcatoire observées dans l’i-ème réalisation (l'i-ème ex- 
périence) pour des valeurs de l’argument #;, £>, . . ., t,. Le symbole 
z; (t,) désigne la valeur correspondant à l'’i-ème réalisation à l’ins- 
tant [4 

Les données obtenues ne sont rien d’autre que les résultats de n 
expériences sur un système de m variables aléatoires 


À (4), X (£2), 9 X (£m) 
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et doivent être traitées comme tels (voir $ 14.3). Tout d’abord on 
trouve les estimations des espérances mathématiques : 


n 


S zu (tn) 


{mi 


Mz (£x) = ea 


puis celles de la variance: 


. (15.4.1) 


: D [za (tn) — mx (tx) P 
De (En) == ———— (15.4.2) 
et enfin les estimations des covariances 


… D [ri (tr) — mx (ta)] (xs (tr) — mx (t1)] 
Ro (En 6) = ——— © —————. (1543) 


Souvent il est commode, lors du calcul des estimations des varian- 
ces et des covariances d'utiliser la relation existant entre les moments 
initiaux et centrés; les formules respectives sont : 


: Ÿ (er () 
Da (tn) == ———(m(n)| TS; (15.44) 


n —1 


n 


: D zi (tr) zi (tu) : : 
Ke (ns 4) = —— — mft)ms (tr) | ——. (15.45) 


n— 1 


Lorsqu'on utilise ces dernières formules, afin d'éviter d'avoir 
affaire à des différences de nombres voisins, on transfère l’origine des 
ordonnées plus près de l'espérance mathématique. 

Après avoir calculé ces caractéristiques, on peut en utilisant la 


suite des valeurs m, (4), m,(t2), ..., M x (tm) déterminer la fonction 
m., (t) (fig. 15.4.1). On construit d'une manière analogue la courbe 
D, (4). La fonction des deux arguments K, (4, t’) s'obtient d’après 
ses valeurs dans un réseau rectangulaire de points. En cas de nécessi- 


té toutes ces fonctions peuvent être approchées par des expressions 
analytiques. 


15.5. Méthodes de calcul des caractéristiques 
des fonctions aléatoires transformées d'après celles 
de fonctions initiales 


Dans le paragraphe précédent nous avons montré comment on cal- 
cule les caractéristiques d'une fonction aléatoire à partir des données 
expérimentales. Cette méthode n'est pas toujours utilisable. Tout 


24—2823 
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d’abord les expériences spéciales nécessaires à la détermination des 
fonctions aléatoires qui nous intéressent peuvent être coûteuses et 
compliquées. Deuxièmement, souvent il y a lieu d'étudier des fonc- 
tions aléatoires caractérisant les erreurs des appareils de mesure, des 
dispositifs de mire, des systèmes de commande, etc. en cours de con- 
ception et n’existant pas encore. On étudie alors ces erreurs éventuel- 
les justement dans le but de choisir les paramètres du système de 
telle sorte que les erreurs soient minimales. Il est évident que dans 
ce cas l’étude directe des fonctions aléatoires caractérisant le fonction- 
nement du système est inutile sinon même impossible. Dans ces cas 
on fait alors appel à des méthodes indirectes. Nous avons déjà utilisé 
des méthodes indirectes dans les chapitres 10, 11, 12 de notre cours, 
où nous avons montré comment on recherche les lois de répartition 
et les caractéristiques numériques des variables aléatoires d’après 
celles d'autres variables aléatoires, liées aux premières. En utilisant 
des méthodes analogues on peut déterminer indirectement les caracté- 
ristiques des fonctions aléatoires d’après les caractéristiques d’autres 
fonctions aléatoires, liées aux premières. La théorie appliquée des 
fonctions aléatoires est essentiellement consacrée au développement 
de ces méthodes indirectes. 

Dans la pratique le problème de l'étude indirecte des fonctions 
aléatoires se pose de la manière suivante. 

Considérons un système dynamique quelconque À ; par « système 
dynamique » on entend un appareil quelconque, un viseur, un calcula- 
teur, un système de commande automatique, etc. Ce système peut 
être mécanique, électrique ou contenir des éléments de toute autre 
nature. On peut se représenter comme suit le fonctionnement du sys- 
tème : l'entrée du système reçoit d’une manière continue certaines 
données ; le système en effectue le traitement et délivre le résultat 
également d’une manière continue. Convenons d'appeler « action » 
les données arrivant à l'entrée du système et « réponse » le résultat 
fourni par le système comme réponse à l'action. Les actions peuvent 
être des tensions variables, des coordonnées angulaires et linéaires 
des objectifs, des signaux ou des commandes reçus par un système 
de commande, etc. De même, la réponse du système peut être élabo- 
rée sous différentes formes: tensions, déplacements angulaires, etc. 

Considérons le cas le plus simple, lorsque l'entrée du système À 
reçoit une seule action, une certaine fonction du temps x ({); la ré- 
ponse à cette action est une autre fonction du temps y (t) (fig. 15.5.1). 

Nous dirons que le système À opère sur l’action d'entrée une cer- 
taine transformation x (t) — y (t) que nous écrirons comme suit: 


y (1) = À {zx (t)}. (15.5.1) 
La transformation À peut être plus ou moins compliquée et pren- 


dre une forme quelconque. Dans les cas les plus simples c’est la mul- 
tiplication par un facteur donné (amplificateurs, mécanismes de mul- 
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tiplication), la dérivation et l'intégration (dispositifs dérivateurs et 
intégrateurs). Cependant on rencontre rarement dans la pratique des 
systèmes réalisant des transformations simples ; en général le fonc- 
tionnement d’un système est décrit par des équations différentielles, 
et la transformation À revient à la résolution d’une équation diffé- 
rentielle reliant l’action zx (+) et la réponse y (t). 


Action Réponse 


Fig. 15.5.1 


Lors de l'étude d’un système dynamique on résout tout d’abord 
le problème essentiel qui consiste à trouver la réponse y (t) du systè- 
me à uneaction donnée z ({). Cependant ceci ne permet pas de faire une 
étude complète du système et d'estimer sa qualité technique. En 


X(t) 


LAS cos 


réalité l’action x (t) n’est jamais un signal pur, elle est toujours affec- 
tée par des erreurs aléatoires (perturbations) qui font que le système 
reçoit à l'entrée non pas la fonction donnée zx ({) mais une fonction 
aléatoire X ({); par conséquent sa réponse est également une fonction 
aléatoire Y (f) différente évidemment de la réponse théorique y (t) 
(fig. 19.5.2). 

Une question se pose lout naturellement : à savoir quelle est la 
grandeur des déformations aléatoires altcrant la réponse du système 
en présence de perturbations aléatoires agissant à l'entrée? Et com- 
ment faut-il choisir les paramètres du système pour que ces déforma- 
tions soient minimales ? 

Ces problèmes ne peuvent pas être résolus par les méthodes clas- 
siques de la théorie des probabilités; seule la théorie des fonctions 
aléatoires permet de les aborder. 

Le premier des deux problèmes posés ci-dessus, le problème direct, 
est évidemment le plus simple. Nous allons formuler ce problème de 
la manière suivante. 

L'entrée du système dynamique : est attaquée par une fonction 
aléatoire X ({); le système effectue une certaine transformation 


24° 
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donnant à la sortie la fonction aléatoire 
Y (4) = À {X (t)}. (15.5.2) 


On connaît l'espérance mathématique et la fonction de corrélation 
de la fonction aléatoire X (f). [l y a lieu de trouver les caractéris- 
tiques analogues de la fonction aléatoire Y (t). Ou plus brièvement : 
trouver les caractéristiques d'une fonction aléatoire à la sortie d’un 
système dynamique connaissant les caractéristiques de la fonction 
d'entrée. 

Le problème posé peut ètre résolu exactement dans un cas parti- 
culier, important pour la pratique, lorsque la transformation À 
appartient à la classe des transformations linéaires, on dit alors que le 
système À appartient à la classe des systèmes linéaires. 

Ces notions seront étudiées dans le paragraphe suivant. 


15.6. Opérateurs linéaires et non linéaires. 
Opérateur d'un système dynamique 


Dans l'exposé de la théorietles transformations des fonctions aléa- 
toires nous allons employer la notion d’opérateur, couramment uti- 
lisée en mathématiques et en technique. 

La notion d'opérateur est une généralisation de celle de fonction. 
Lorsqu'on établit une relation fonctionnelle entre les variables 
y et x et que l’on écrit: 

y = f(x) (15.6.1) 


le symbole f indique la règle suivant laquelle à une valeur donnée 
x on fait correspondre une valeur déterminée y. Le signe f est le sym- 
bole d’une certaine transformation qu'il y a lieu d'imposer à z pour 
obtenir y. Suivant le genre de la transformation les fonctions corres- 
pondantes peuvent être linéaires ou non linéaires, algébriques, 
transcendantes, etc. 

Des notions analogues ct des symboles correspondants sont uti- 
lisés en mathématiques pour représenter une transformation d’une 
fonction. .* 

Etablissons pour une certaine fonction x ({) une loi de transforma- 
tion en une autre fonction y (f). Ecrivons cette transformation sous 


la forme : 
y (1) = À {x (t)}. (15.6.2) 


A titre d'exemple on peut citer la dérivation: 


dz 
y (1) = <= (15.6.3) 
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ou l'intégration: 
! 
y (t)— { z(v dr, (15.6.4) 
U 
etc. 

La règle permettant de passer de la fonction x (f) à la fonction 
y (t) est appelée opérateur ; par exemple on parlera d'opérateurs de 
dérivation, d'intégration, de résolution d’une équation différentielle, 
etc. 

Dans notre définition de l'opérateur nous n'avons envisagé que la 
transformation d'une fonction zx ({) en une autre fonction y du même 
argument {. Pourtant cette conservation de l'argument n'est pas du 
tout obligatoire: un opérateur peut transformer la fonction zx (t) 
en une fonction y (s) d'un autre argument, par exemple: 


b 
y (s)— | p(t, s)z(f)dt, (45.6.5) 


où (f£, s) est un certaine fonction, dépendant en plus de l’argu- 
ment {, d’un autre argument s. 

Mais comme lors de l’analyse des erreurs des systèmes dynamiques, 
l'argument le plus naturel est le temps t, nous nous limiterons à l’étu- 
de des opérateurs transformant une fonction de { en une autre fonc- 
tion du même argument. 

Si un système dynamique transforme la fonction z (tf) appliquée 
à son entrée en une autre fonction y (£): 


y (t) = À {x (t)}, 


l'opérateur À est appelé opérateur du système dynamique. 

Dans le cas général l'entrée du système est attaquée non pas par 
une seule mais par plusieurs fonctions ; de même à sa sortie on peut 
voir apparaître plusieurs fonctions ; dans ce cas l’opérateur du systè- 
me transforme un ensemble de fonctions en un autre ensemble de 
fonctions. Cependant pour simplifier l’exposé nous n’envisagerons 
ici que le cas le plus élémentaire de transformation d’une fonction 
isolée en une autre. 

Les transformations ou les opérateurs appliqués aux fonctions 
peuvent être de types différents. La classe la plus importante pour 
la pratique est celle des opérateurs linéaires. 

Un opérateur L est appelé linéaire homogène s'il est doué des pro- 
prictés suivantes : 

1) il peut être appliqué séparément à chacun des termes d'une 
somme : 


L {xs (9) + 22 (4)} = L {x (t)} + L{z(t))}; (15.6.6) 
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2) un facteur constant c peut être mis en facteur devant le signe 
de l'opérateur : 


L {cz (t)} = cL {zx (t)}. (15.6.7) 


[1 découle de la seconde propriété que pour un opérateur linéaire 
homogène on a: 


L {0} = 0, (15.6.8) 
c'est-à-dire que la réponse à zéro est égale à zéro. 
À titre d'exemple d’opérateur linéaire homogène on peut citer: 
1) l'opérateur de dérivation : 
y (t)= 


2) l'opérateur d'intégration: 
t 


y(= (za; 
U 
3) l'opérateur de multiplication par une fonction (ft): 


y (4) = p(t) zx (t); 
4) l'opérateur d'intégration pondérée par la fonction (4): 


= ©. 


L 
TOP ETC IQ 


etc. 

À part les opérateurs linéaires homogènes il existe encore des opé- 
rateurs linéaires irhomogènes. 

L'opérateur L est dit linéaire inhomogène s'il est formé par un opé- 
rateur linéaire homogène et par une fonction donnée œ ({t) additive: 


L{zx(t)} = Lo{z(}+ (0), (15.6.9) 


où L, est un opérateur linéaire homogène. 
Donnons quelques exemples d'opérateurs linéaires inhomogènes : 


1) = dv, 
TOP ETCTTO LE EAUTO 


3) y (1) = qu (0) x (8) + p2 (0), 
où œp (4), mi (£), 2 (t) sont des fonctions données, et x (t) la fonction 
transformée par l'opérateur. 

En mathématiques et en technique on utilise souvent une forme 
symbolique spéciale pour désigner les opérateurs. Dans certains cas 
des notations symboliques simplifient considérablement des transfor- 
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mations et permettent d'écrire des formules sous une forme simple et 
commode. 

Par exemple, l'opérateur de dérivation est souvent désigné par 
la lettre p: 


__d 
P— x 
mis en facteur devant l'expression à dériver. Ainsi les formes: 
y (t) = pz (t) 
et 
= t 


sont équivalentes. 
Une double dérivation est désignée par p*: 


d? 
pr (= 0), 


etc. 

Cette forme symbolique est surtout commode pour l'écriture 
des équations différentielles. 

Supposons par exemple que le fonctionnement du système dyna- 
mique À soit décrit par une équation différentielle linéaire à coeffi- 
cients constants liant la réponse du système y (£t) et l’action x (t). 
Sous la forme habituelle cette équation différentielle s'écrit : 

1 
0 4e. + 4e ar + eg (= 


dmxz (t) dmn-iz (1) dx “o 
— br din + bn 5 — dm i + : + b, 


(15.6.10) 


Sous la forme symbolique on a: 
(anp" +an4p" +... + @p + @o) y (t) = 
= (bnP" + bmp" +... + bip + bo) x (Et), 
où p=— L est l'opérateur de dérivation. 


Pour plus de simplicité nous allons désigner comme suit les poly- 
nômes en p se trouvant dans les premier et second membres: 


Ah (P) = QnP" +an4p" +... + a;Pp + @, 
Bm(P) =bmP" + bmp" +... +bip+bo, 


ce qui nous permet d'écrire l'équation en question sous une forme 
encore plus simple, soit : 


An ) y (t) = Bn (p) z (1). (15.6.11) 


Enfin en résolvant formellement l'équation (15.6.11) par rapport 
à y (t), on obtient la solution de l'équation différentielle « explicite », 
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B 
y ()=5E ee z (6). (15.6.12) 

En utilisant des notations symboliques analogues on peut écrire 
sous forme opérationnelle une équation différentielle linéaire à coef- 
ficients variables. Habituellement cette équation s'écrit sous la 
forme : 


an () LEO on (0 LEO + La () HO à 0 (9) y (D = 
= D (9) + Des (9) mr + + Hd (0) + Bi () z (D. 


(15.6.13) 


Introduisons pour les polynômes en p à coefficients dépendant 
du temps les désignations suivantes : 


An (p,t)=an(t) p°+an-s(t) pi +... Ha (t) p + @o (4), 
Br (P, t) = dm (t) P" + bm-1 (4) PT +... + bi (E) p + bo (6). 
Alors l'opérateur de Mu différentielle s'écrit : 


y (t) = re ge ; z (+). (15.6.14) 

Nous utiliserons ultérieurement quand il sera besoin cette dési- 
gnation pour les opérateurs. 

Les systèmes dynamiques que l’on rencontre souvent en pratique 
sont dans la majorité des cas décrits par des équations différentielles 
linéaires. 11 est facile de voir que dans ce cas l'opérateur du système 
est également linéaire. 

Un système dynamique dont l'opérateur est linéaire est appelé 
système dynamique linéaire. 

En plus des opérateurs et des systèmes linéaires on rencontre des 
opcrateurs et des systèmes non linéaires. A titre d'exemple d’opéra- 
teurs non linéaires on peut citer 


y(t)=2 (1); 1O= [sr y(t)=sinz(t) 
ou bien la solution d’une équation différentielle non linéaire, par 


exemple : 
y" () + a cos y (t) = zx (1). 


Un système dynamique dont l'opérateur n'est pas linéaire est 
appelé système non linéaire. 

On rencontre souvent dans la pratique des systèmes linéaires. 
Cette propriété de linéarité permet d'appliquer à l'étude des erreurs 
des systèmes la théorie des fonctions aléatoires. Tout comme les 
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caractéristiques numériques des fonctions linéaires de variables aléa- 
toires ordinaires peuvent être obtenues à partir des caractéristiques 
numériques des arguments, celles d’une fonction aléatoire à la sortie 
d’un système dynamique linéaire s’obtiennent si l’on connaît l’opé- 
rateur du système et des caractéristiques de la fonction aléatoire 
d'entrée. 

Encore plus souvent dans la pratique on rencontre des systèmes 
qui ne sont pas rigoureusement linéaires mais admettant une linéa- 
risation. Si les perturbations aléatoires à l'entrée du système sont 
suffisamment petites, tout système peut en fait, dans les limites de 
ces perturbations, être considéré comme approximativement linéaire, 
tout comme pour des variations aléatoires suffisamment petites des 
arguments presque toute fonction peut être linéarisée. 

La méthode de linéarisation approchée des équations différen- 
tielles est couramment utilisée dans la théorie des erreurs des systè- 
mes dynamiques. 

Dans la suite nous n'étudierons que des systèmes dynamiques li- 
néaires (ou linéarisables) et des opérateurs linéaires correspondants. 


15.7. Transformations linéaires des fonctions 
aléatoires 


Supposons qu’à l'entrée d'un système linéaire d’opérateur L 
on applique une fonction aléatoire X (f) d'espérance mathématique 
m, (t) et de fonction de corrélation X, (t, t’) données. La réponse du 
système est une fonction aléatoire 


Y (t) = L{X (t)}. (15.7.1) 


Il s’agit de trouver les caractéristiques de la fonction aléatoire 
Y (t) à la sortie du système, à savoir m, (t) et K, (t{, t’). Autrement 
il faut trouver les caractéristiques de la fonction aléatoire de sortie 
à partir de celles du signal appliqué à l'entrée du système. 

Nous allons tout d’abord montrer qu'on peut se limiter au cas 
d’un opérateur homogène. En effet supposons que l'opérateur L ne 
soit pas homogène et s'exprime par la formule: 


L {X (9} = Lo {X (D} + (15.7.2) 


où Z, est un opérateur linéaire homogène et y (f) une fonction quel- 
conque non aléatoire. On a alors: 


my (9 = M [Le {X 9} + g (0, (15.7.3) 


c'est-à-dire que la fonction œ (t) s'ajoute simplement à l'espérance 
mathématique de la fonction aléatoire à la sortie du système linéaire. 
Pour ce qui est de la fonction de corrélation, elle ne change pas lors- 
qu’on ajoute à la fonction aléatoire un terme non aléatoire. 
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C'est pourquoi dans l’exposé ultérieur on entendra par opérateurs 
linéaires des opérateurs linéaires homogènes. 

Nous allons tout d'abord déterminer les caractéristiques de 
sortie d'un système linéaire pour certains cas particuliers d'opéra- 
teurs. 


1. Intégrale d'une fonction aléatoire 


Soit une fonction aléatoire X (?) d'espérance mathématique m, (t) 
et de fonction de corrélation X, (4, t#”’). La fonction aléatoire Y (4) 
est liée à X (4) par l’opérateur homogène d'intégration: 


Y (t)= | X (x) dr. (15.7.4) 


Trouver les caractéristiques Ÿ (£), à savoir m, (t) et K,, (t, t”). 
Ecrivons l’intégrale (15.7.4) comme la limite d'une somme: 


Y (t) " X(dr= lim D X (r) 4x, (15.7.5) 


et trouvons l'espérance mathématique de l'égalité (15.7.5). En vertu 
du théorème d’addition des espérances mathématiques on a: 


my(t) = MIT (1= lim >, MIX (xi)] At= 


— lim ÿ» mx (ti) AT = | m,(r) dt°), (15.7.6) 
î Ü 


ät—0 


my (t) = | mx (T) dt, (15.7.7) 


c'est-à-dire que l'espérance mathématique de l'intégrale d'une fonction 
aléatoire est égale à l'intégrale de son espérance mathématique. En d’au- 
tres termes on peut intervertir les opérations d'intégration et de 
recherche de l'espérance mathématique. Ce résultat est tout naturel, 
car une intégration ne diffère pas dans sa nature d’une sommation 
qui, comme nous l’avons déjà vu, peut être interchangée avec l’opéra- 
tion d'espérance mathématique. 


*) On suppose que l'espérance mathématique de la limite est égale à la 
limite de l'espérance mathématique. En pratique on a généralement affaire 
à des fonctions pour lesquelles ceci est vrai. 
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Calculons maintenant la fonction de corrélation K, (t, t{”). A cet 
effet nous passons aux fonctions aléatoires centrées : 


X(H=X(O—m.(t); Ÿ(H=Y(#)—m, (#. 


Il est facile de voir que 


L 
Ÿ (t)— | X (D dr. (15.7.8) 


Par définition de la fonction de corrélation : 
K,(t,t)=MIY (@)Ÿ (), 
où 


t | 26 
Ÿ (= Î X (mdr; Ÿ(t)= | X(x')dr'*).  (15.7.9) 
0 
Faisons le produit des expressions (15.7.9) : 
î t° 
YHŸ() = | X (x) dr | X (x')d”. (15.7.10) 
U U 


Il est facile de voir que le produit des deux intégrales de (15.7.10) 
est égal à l’intégrale double: 


tt 
| | X (TX (x')ar av’. (15.7.11) 

0 0 
Comme la fonction sous l'intégrale dans (15.7.11) est le produit de 
deux facteurs dont le premier ne dépend que de + et le second que de 


t’, l'intégrale double (15.7.11) se décompose en deux intégrales sim- 
ples (15.7.10). Par conséquent : 


t t’ 
rore)=[ XX tw)aar. (15.7.12) 
0 0 


En prenant l'espérance mathématique de l'équation (15.7.12) et 
en intervertissant cette opération avec celle d'intégration on obtient : 


{ 1’ 
Kilt, t')=MIŸ (0 Ÿ (t)1— | | MIX (x) X (x')] ddr 
0 U 


*) On sait que dans une intégrale définie la variable d'intégration peut 
être désignée par une lettre quelconque; ici il est commode d'utiliser les dési- 
gnations + et +’ respectivement. 
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ti !?’ 
Ke, t')= | ÎK: (x, v'har dr’. (15.7.13) 
0 0 


Ainsi pour trouver la fonction de corrélation de l'intégrale d’une 
fonction aléatoire, il faut intégrer deux fois la fonction de corréla- 
tion de la fonction aléatoire initiale, d’abord sur l’un des arguments, 
puis sur l’autre 


2. Dérivée d'une fonction ‘aléatoire 


Soit une fonction aléatoire X (£) d'espérance mathématique m. (t) 
et de fonction de corrélation ÆX, (t, t’). La fonction aléatoire Y (ft) 
cst liée à la fonction aléatoire X (t) par l'opérateur homogène linéaire 
de dérivation: 


Y(6=<0. (15.7.14) 


Il y a lieu de trouver m, (t) et X, (t, t’). 
Ecrivons la dérivée comme la limite: 


Due XG+AD—X (0 
Y (£) = lim Pre -Ap --à 


(15.7.15) 
àt—0 


En prenant l'espérance mathématique des deux membres de l'éga- 
lité (15.7.15) on obtient: 


; x At)—m> dmx(t) * 


d'où 


m (= 0, (15.7.16) 


c'est-à-dire que l'espérance mathématique de la dérivée d'une fonction 
aléatoire est égale à la dérivée de son espérance mathématique. Par consé- 
quent, l’opcration de dérivation tout comme celle d'intégration peut 
étre intervertie avec celle de l'espérance mathématique. 

Pour trouver K, ({, &”) nous allons passer aux fonctions aléatoires 


centrées Ÿ (£) et X ( : de toute évidence on a: 


(15.7.17) 
Par définition: 


K,(t,#)=MIY (0 Ÿ (t)1. 


*) Voir note à la page 378. 
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En remplaçant Ÿ (£) et Ÿ (£”) par leurs expressions, on a: 


K, (, y =M [#0 ts, 


Ecrivons l'expression sous le signe de l'espérance mathématique 
comme une dérivée partielle mixte, soit: 


aX(e) aX(r) _ æ2X (D X(#) 
LE 0) L SO EU)., (15.7.18) 


Nous avons montré que l'espérance mathématique de la dérivée 
d’une fonction aléatoire est égale à la dérivée de son espérance mathé- 
matique, c'est-à-dire que les signes de dérivation et d'espérance ma- 
thématique peuvent être intervertis. Par conséquent : 


; o2X (0) À (t°) 
Ru 2) = M ra] = gror M LÀ EN = gp Ka (Et. 
(15.7.19) 
Par conséquent : 
; 92K,(t, t’ 
K,(,t)= en, (15.7.20) 


Ainsi pour trouver la fonction de corrélation d'une dérivée il 
y a lieu de dériver deux fois la fonction initiale successivement par 
rapport à l’un et à l’autre de ses arguments. 

En comparant les règles de recherche de l’ espérance mathématique 
et de la fonction de corrélation pour les deux opérateurs homogènes 
linéaires envisagés, on voit que ces règles sont analogues. Pour trou- 
ver l'espérance mathématique de la fonction aléatoire transformée 
il y a lieu d'appliquer l'opérateur à l'espérance mathématique de la 
fonction aléatoire initiale; pour trouver la fonction de corrélation 
il y a licu d’appliquer ce même opérateur deux fois à la fonction de 
corrélation de la fonction aléatoire initiale. Dans le premier cas 
c'était une intégration double, dans le second une double dérivation. 

On peut montrer que cette règle est générale pour tous les opéra- 
teurs linéaires homogènes *). Ici nous donnons cette règle sans démons- 
tration. 

Si un opérateur L transforme une fonction aléatoire X (t) d’espé- 
rance mathématique m, (t{) et de fonction de corrélation K. (t, t’) 
en une autre fonction aléatoire 


Y (D = L {X D}, 
*) Voir, par exemple, V. Pougatchev. Théorie des fonctions aléatoires et 


ses applications aux problèmes de la commande automatique (en russe). Fizmathguiz, 
Moscou, 1962. 
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pour trouver l'espérance mathématique de Y (ft) il y a lieu d'appli- 
quer le même opérateur à l'espérance mathématique de X (£): 


my (t) = L {m,(t)} (15.7.21) 


et pour trouver la fonction de corrélation il faut appliquer deux 
fois le même opérateur à la fonction de corrélation de X (ft), d’abord 
suivant le premier argument, puis suivant le second : 


Kytt, t)=LOLOEK, (1, t)). (15.7.22) 


Dans la formule (15.7.22) les indices (4), ({’) dont est marqué 
l'opérateur indiquent l'argument suivant lequel il y a lieu de l’appli- 
quer. 

Dans de nombreux problèmes, ce qui intéresse en fin de compte 
ce n’est pas la fonction de corrélation K', (t, £{”) à la sortie du systè- 
me linéaire, mais la variance D, (t) caractérisant la précision de fonc- 
tionnement du système en présence de perturbations aléatoires. 
On peut trouver la variance D, (t) à partir de la fonction de corré- 
lation : 

D, (t) = Ky (4, t’). (15.7.23) 


11 faut ici souligner qu’en général, pour trouver la variance à la 
sortie d’un système linéaire, il ne suffit pas de connaître la variance 
à l’entrée, mais aussi la fonction de corrélation. En effet, un système 
linéaire peut réagir tout à fait différemment à des perturbations aléa- 
toires agissant à son entrée, suivant la structure interne de celles-ci ; 
suivant, par exemple, qu'elles se composent essentiellement d’oscil- 
lations haute ou basse fréquence. Or, la structure interne d’un pro- 
cessus aléatoire est décrite non pas par sa variance, mais par sa fonc- 
tion de corrélation. 

Exenple. L'entrée d’un mécanisme dérivateur est attaquée par une 


fonction aléatoire X (t) d'espérance mathématique m. ({) = sin £ ct de fonction 
de corrélation 


où D, est la variance constante de X (1). 
Trouver l'espérance mathématique et la variance à la sortie du système. 


Solution. La fonction aléatoire Y (f) à la sortie du système (réponse) 
est liée à l’action X (t) par l'opérateur de dérivation: 


d 
En appliquant les règles générales on oblient: 
d 
my (==. Mx ({)= cos ! ; 


2 


d n — —a(t—1)2 p4 r__ 2 
Joe Ka (t, t’) = 2D,ae [1 — 20 (4° —1)2]. 


Ky (2, Fi= 
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Posant {’ —=1+t, on a 
D, (t) = 2D,c, 
ou, en remarquant que D, (t) ne dépend pas de t, 
D, = 2D,c. 


Ainsi, la variance à la sortie d’un mécanisme dérivateur dépend 
non seulement de la variance D, à l’entrée mais également d'un coef- 
ficient & caractérisant la rapidité de décroissance de la corrélation 
entre les sections de la fonction aléatoire X ({) lorsque l'intervalle les 
séparant augmente. Si le coefficient «& est petit, la corrélation s’amor- 
tit lentement, la fonction aléatoire varie dans le temps d'une ma- 
nière relativement régulière, dans ce cas la dérivation conduit à des 
erreurs relativement peu importantes. Au contraire si le coefficient « 
est grand, la fonction de corrélation décroît rapidement ; la fonction 
aléatoire se compose essentiellement d'oscillations désordonnées 
à haute fréquence; la dérivation de cette fonction conduit évidemment 
à des erreurs aléatoires importantes. Généralement on utilise dans 
ces cas la méthode de lissage de la fonction, à cette fin on modifie 
l'opérateur du système de sorte à diminuer les erreurs aléatoires à la 
sortie. 


15.8. Addition des fonctions aléatoires 


Dans la pratique il est rare que l'entrée du système dynamique 
soit attaquée par une seule fonction aléatoire X (f); souventilyena 
deux ou plus, chacune d’elles étant due à l’action d'un facteur per- 
turbateur. Il s’agit alors de prendre la somme des fonctions aléatoires 
ou, plus précisément, de trouver les caractéristiques d’une somme 
à partir des caractéristiques des composantes. 

Ce problème est élémentaire dans le cas où les composantes sont 
des fonctions aléatoires indépendantes (plus exactement non corré- 
lées) entre elles. Dans le cas général il faut connaître encore une carac- 
téristique, à savoir la fonction de corrélation mutuelle. 

On appelle fonction de corrélation mutuelle des deux fonctions 
aléatoires X ({) et Y (4) une fonction certaine de deux arguments # 
et £’ qui pour tout couple de valeurs f, {” est égale à la covariance 
des sections correspondantes des fonctions aléatoires X (£) et Y (t): 


Rate t)=MIX (0 Ÿ (1. (15.8.1) 


La fonction de corrélation mutuelle, tout comme la fonction de 
corrélation ordinaire, ne change pas lorsqu'on ajoute aux fonctions 
aléatoires des composantes non aléatoires quelconques et par consé- 
quent lors du centrage des fonctions aléatoires. 

Par définition de la fonction de corrélation mutuelle on a: 


Rays t)=Ryxlt'it). (15.8.2) 
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Souvent au lieu de la fonction R,, (t, t”) on utilise la fonction de 
corrélation mutuelle normeée : 


 Raxylt,t') 
Ty (é, l ) = 


Oz (t) O4 (t”) è 


Si la fonction de corrélation mutuelle est égale à zéro pour toutes 
les valeurs de £, {”, les fonctions aléatoires X (t) et Y (t) sont dites non 
corrélées (non liées). 

Généralement dans la pratique on établit que des fonctions aléa- 
toires ne sont pas corrélées non pas en se basant sur le fait que leur 
fonction de corrélation mutuelle est nulle ; bien au contraire, on pose 
cette dernière nulle en partant des considérations physiques suivant 
lesquelles les fonctions aléatoires étudiées doivent être indépendantes. 

Soient, par exemple, deux fonctions aléatoires X (t) et Y (6) 
correspondant aux oscillations de la tension du secteur en deux points 
différents, alimentés par des sources différentes; physiquement 
indépendantes ; les deux fonctions aléatoires X (f) et Ÿ (£) sont alors 
non corrélées. Si les deux points sont alimentés par la même source, 
il est naturel de supposer que les fonctions X (£) et Y (ti) sont corrélées. 

En général, si des considérations physiques suggèrent qu'il doit 
exister une relation entre les fonctions aléatoires figurant dans le 
problème, il y a lieu d'étudier leurs fonctions de corrélation mutuelles. 

Connaissant les espérances mathématiques, les fonctions de corré- 
lation ainsi que la fonction de corrélation mutuelle des fonctions 
aléatoires X (£) et Y (t), on peut trouver les caractéristiques de leur 


somme : 
ZH=X(+Y(E. (15.8.4) 


En vertu du théorème d’addition des espérances mathématiques 
on a: 


(15.8.3) 


m,( =m,(t) + m, (, (15.8.5) 


donc l'espérance mathématique de la somme de deux fonctions aléatoires 
est égale à la somme de leurs espérances mathématiques. 
Pour trouver la fonction de corrélation K, ({, {’) passons aux fonc- 


tions aléatoires centrées Z (£), X (£), Ÿ (t). On a de toute évidence: 
Z (0 = X (9 + Ÿ (b. (15.8.6) 
Par définition de la fonction de corrélation : 
K,({, #)= MIZ (0 Z (#)] = 
= MX () + Ÿ (@) (À () + Ÿ #1 = 
= MIXOXCN+MPFOŸÏCN+MIXOY (EN + 
+ MIX (€) Ÿ (] 
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ou 
Ki(t,t)=Kalet)+K,(t)+ Rat E)+ Rey, t). (5.8.7) 


La formule (15.8.7) est analogue à (10.2.7) pour la variance d'une 
somme de variables aléatoires. 

Lorsque les fonctions aléatoires X ({) et }” (£) ne sont pas corré- 
lées, donc R., (t, t’) = 0, la formule (15.8.7) devient : 


K,(t,t)=K,(t,t')- Ke, t'). (15.8.8) 


Ainsi la fonction de corrélation de la somme de deux fonctions aléatoires 
non corrélées est égale à la somme de leurs fonctions de corrélation. 

Les formules ci-dessus peuvent ètre généralisées au cas d’un nom- 
bre aléatoire de composantes. Si la fonction aléatoire X ({) est la 
somme de nr fonctions aléatoires : 


n 
X (= > Xi(t). (15.8.9) 
151 
son espérance mathématique est donnée par la formule: 


ms () = à me, (t) (15.8.10) 


et sa fonction de corrélation par la formule: 
K;(t,t)= D Kr,(,1)+ D Rae, (t, l’), (15.8.11) 
i=1 if) 


où la sommation s'étend à toutes les combinaisons possibles des indi- 
ces i et 7] deux à deux. 

Dans le cas où les fonctions aleatoires X; ({) sont toutes non corré- 
lées deux à deux, la formule (15.8.11) devient le théorème d’addition 
des fonctions de corrélation : 


K,(t,t')= Ke; (4, t') (15.8.12) 


qui se lit comme suit : la fonction de corrélation d'une somme de fonc- 
tions aléatoires non corrélées deux à deux est égale à la somme des fonctions 
de corrélation des composantes. 

La formule (15.8.12) est analogue au théorème d'’'addition des 
variances des variables aléatoires. 

L’addition d'une fonction aléatoire et d’une variable aléatoire 
est un cas particulier de l’addition des fonctions aléatoires. 

Soient une fonction aléatoire ZX (ft) de caractéristiques m, (6) 
et X, (t, t’) et une variable aléatoire Ÿ d'espérance mathématique 
m, et de variance D ,. Supposons que X (t) et Y ne soient pas corré- 
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lées, c’est-à-dire que pour £ quelconque on ait: 
MIX ( Y1 = 0. 


Ajoutons à la fonction aléatoire X ({) la variable aléatoire Y ; 
lc résultat de l’addition est une fonction aléatoire : 


Z( = X (t) + Y. (15.8.13) 
Calculons les caractéristiques de cette dernière. Il est évident que: 
m,tt)=m,(t) + m,. (15.8.14) 


Pour trouver Æ. (t, t’) considérons la variable aléatoire ŸY comme 
un cas particulier de la fonction aléatoire ne variant pas dans le 
temps et cherchons sa fonction de corrélation: 


K,(,#)=MY(Y (4) = MI) =D, (15.8.15) 


A partir de la formule (15.8.8) d’'addition des fonctions de corré- 
lation on obticnt: 


K:(4,1)=K,(t, 4) + D,, 


c'est-à-dire que la fonction de corrélation de la somme d'une fonction 
aléatoire et d'une variable aléatoire non corrélée avec cette fonction 
est égale à la somme de la fonction de corrélation de la fonction aléatoire 
et d'un terme constant égal à la variance de la variable aléatoire. 


15.9. Fonctions aléatoires complexes 


Dans la pratique lorsqu'on utilise l'appareil mathématique des 
fonctions aléatoires, il est souvent commode d'écrire tant ces dernièe- 
res que leurs caractéristiques non 
pas sous forme réelle, mais sous 
forme complexe. A cet effet il 
y a lieu de donner une définition 
d'une variable aléatoire complexe et 
d'une fonction aléatoire complexe. 

On appelle variable aléatoire 
complexe une variable aléatoire 
«de la forme: 


Z=X+iY, (15.9.1) 
où À, Ÿ sont des variables aléa- 
Fig. 15.9. {oires réelles; i=Y—1 est 
l'unité imaginaire. 
Géométriquement une variable aléatoire complexe peut être inter- 
prétée comme un point aléatoire variable Z dans le plan z0y 
(fig. 15.9.1). 
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Pour appliquer l'appareil des caractéristiques numériques aux 
variables aléatoires complexes, il y a lieu de généraliser à ces derniè- 
res les notions fondamentales d'espérance mathématique, de variance 
et de covariance. Il est évident que ces généralisations doivent être 
telles que dans le cas particulier, où Y = 0 et Z réel, elles se rédui- 
sent aux caractéristiques habituelles des variables aléatoires. 

On appelle espérance mathématique de la variable aléatoire complexe 
Z = X +iY le nombre complexe 


m,=m, + im. (15.9.2) 


C'est une certaine valeur moyenne de Z ou, géométriquement, le 
point moyen m, autour duquel il y a dispersion du point aléatoire 
Z (fig. 15.9.1). | 

On appelle variance d'une variable aléatoire complexe l'espérance 
mathématique du carré du module de la variable aléatoire centrée asso- 


Ld 


ciée : 
D,= MZ F1, (15.9.3) 
Z=17— m,. 


Du point de vue géométrique la variance d'une variable aléatoire 
complexe n'est rien d'autre que la valeur moyenne du carré de la 
distance du point aléatoire Z à son espérance mathématique m, 
(fig. 15.9.1). Cette grandeur caractérise la dispersion du point aléatoi- 
re Z autour de sa position moyenne. 

Exprimons la variance d'une variable aléatoire complexe en fonc- 
tion de ces parties réelle et imaginaire. De toute évidence on a: 


Z=Z-m=-X+iY-m,—im, = X +iŸ, 


« 


ou 


d'où 
D,=MIIZ"- MIX + Ÿ= MIX + MY" 
ou 
D,=D.;+0D,, (15.9.4) 


c'est-à-dire que la variance d'une variable aléatoire complexe est égale 
à la somme des variances de ses parties réelle et imaginaire. 

Par définition, la variance d’une variable aléatoire complexe 
est toujours réelle et essentiellement positive. Elle ne peut s'annuler 
que si la variable Z n’est pas aléatoire. 

Evidemment les définitions ci-dessus de l'espérance mathémati- 
que et de la variance satisfont à la condition imposée de devenir 
pour Ÿ — 0 et Z — X les définitions habituelles de l'espérance 
mathématique et de la variance d’une variable aléatoire réelle. 

Essayons maintenant de donner une définition analogue aux co- 
variances de deux variables aléatoires complexes Z, et Z, 


Z: —= X: + iY 1; Z2 = X2 + iY 2. (15.9.5) 


25" 
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Cette définition doit évidemment être telle que pour Z, = Z: = 
— Z la covariance devienne la variance de Z. On ne peut pas satisfai- 
re à cette condition en définissant, comme dans le cas de variables 
réelles, la covariance comme l'espérance mathématique du produit 


223: Il est facile de voir que pour Z, — Z2 — Z l'espérance mathé- 
matique de ce produit sera non pas réelle mais complexe, cependant 
la variance est réelle et essentiellement positive par définition. 
Pour surmonter cette difficulté vn définit la covariance comme 


l'espérance mathématique du produit de Z: par le complexe conjugué 
de 22: _ 
EE CET: 2 (15.9.6) 


Pour Z, = Z: — Z la covariance deviendra évidemment la varian- 
ce de Z: 


Kz=MUX+iY)(X—iŸ) = MIX] M [Ÿ2]=D,. (45.9.7) 


[Il paraît donc raisonnable de s’arrêter sur la définition suivante 
de la covariance de deux variables aléatoires complexes Z, et Z:: 


Kaur, = M (222), (15.9.8) 


où le trait au-dessus de la lettre indique le complexe conjugué de la 
variable aléatoire respective. 

Exprimons la covariance de deux variables aléatoires complexes 
en fonction des covariances de leurs parties réelles et imaginaires. 
On a ainsi: 


Kage, = M (2322) = M (Xi + iŸ 3) (Xe —iŸ2)] = 
=Kis,+Ryv, + (Rue, — Kxuy.)s (15.9.9) 


OÙ Karim Kyives Kuixss An Sont les covariances des couples de 
variables (X1, X)), (T1, Y 2); (Yi, X >), (X, Y 3) respectivement. 
I1 est évident que lorsque toutes ces variables ne sont pas corré- 
lées entre elles, la covariance des variables Z,, Z, est également nulle. 
Résumons les particularités qui différencient les définitions habi- 
tuelles des caractéristiques des variables aléatoires réelles de celles 
des variables aléatoires complexes : 

4) la variance n'est plus l'espérance mathématique du carré de la 
variable aléatoire centrée, mais l'espérance mathématique du carré 
de son module ; 

2) la covariance ne se définit plus comme l'espérance mathémati- 
que du produit des variables centrées, mais comme celle du produit 
d'une variable centrée par le complere conjugué de l’autre. 
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Nous allons passer maintenant à la définition d’une fonction aléa- 
toire complexe et de ses caractéristiques. 
On appelle fonction aléatoire complexe une fonction de la forme: 


ZH=X(+iY (b, (45.9.10) 


où À (£), Y (ft) sont des fonctions aléatoires réelles. 
L'espérance mathématique de la fonction aléatoire complexe 
(15.9.10) est égale à: 


m, (t) = m,(t) + im, (6. (45.9.11) 


La variance de la fonction aléatoire complexe Z (t) est l’espé- 
rance mathématique du carré du module de la fonction centrée cor- 
respondante : 


D, (t)=M11Z (0 lI, (15.9.12) 
où 
20=2(—m,() = X (0 + iŸ (à. (15.9.13) 


On déduit de (15.9.12) que la variance d’une fonction aléatoire com- 
plexe est réelle et non négative. 

En vertu de la formule (15.9.4) la variance d'une fonction aléa- 
toire compiexe est égale à la somme des variances de ses parties réelle 
et imaginaire : 

D, (t) = D, (9 + D, (©. (15.9.14) 


La fonction de corrélation d’une fonction aléatoire complexe est 
la covariance de ses sections t et {”: 


K.(,t)}=M(Z(H2Z(4). (15.9.15) 
où : 

Za)=X(«t)—iY() 
est la fonction complexe conjuguée de Z (£”). 


Pour t’ = t la fonction de corrélation devient évidemment une 


variance : 
K,(t, à = D, (t). (19.9.16) 


En utilisant la formule (15.9.9) on peut exprimer la fonction de 
corrélation d’une fonction aléatoire complexe à l’aide des caracte- 
ristiques de ses parties réelle et imaginaire. Si les fonctions Z, et Z2: 
figurant dans cette formule sont les sections Z (t) et Z ({’) d'une fonc- 
tion aléatoire, on obtient : 


Kit )=K (el) +R d)HifRa (D —Reytt)} (15.917) 
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où R;y (ft, t’) est la fonction de corrélation mutuelle des fonctions 
aléatoires X (t) et Y (£) (parties réelle et imaginaire de la fonction 
Z (t)). 

Dans le cas où les parties rcelle et imaginaire d’une fonction aléa- 
toire ne sont pas corrélées [R,, (t, t’) = 0}, la formule (15.9.17) 
devient : 

K:(t,t')=K,.(t,t')+K, (et). (15.9.18) 


Dans l'exposé ultérieur nous utiliserons tant la forme réelle que 
la forme complexe des fonctions aléatoires. Dans ce dernier cas nous 
en ferons toujours mention. 


CHAPITRE 16 


DÉVELOPPEMENTS CANONIQUES 
DES FONCTIONS ALÉATOIRES 


16.1. Méthode des développements canoniques. 
Représentation de la fonction aléatoire sous la forme 
d’une somme de fonctions aléatoires élémentaires 


Dans le $ 15.7 nous avons étudié les règles générales des transfor- 
mations linéaires des fonctions aléatoires. Ainsi, lors d'une transfor- 
mation linéaire d'une fonction aléatoire, son espérance mathématique 
subit la méme transformation linéaire, et sa fonction de corrélation 
se trouve scumise à cette transformation deux fois, par rapport 
a l’un et l’autre de ses arguments. 

La règle de transformation de l'espérance mathématique est assez 
simple et ne présente aucune difficulté lors de son utilisation. Pour 
ce qui est de la double transformation de la fonction de corrélation, 
elle conduit souvent à des calculs fort compliqués, ce qui rend diffi- 
cile l'emploi pratique des méthodes générales examinées. 

En effet, soit l’exemple simple de l'opérateur intégral : 


Y(= [xt (16.1.1) 


En vertu de la règle genérale la fonction de corrélation est trans- 
formée deux fois par le même opérateur : 
tt 


K,(t)= À [Kite vhdrar’. (16.1.2) 
0 0 


Très souvent la fonction de corrélation Æ, (f{, {’) obtenue expéri- 
mentalement ne peut s'exprimer sous forme analytique et se trouve 
donnée par un tableau; dans ce cas l'intégrale (16.1.2) doit étre cal- 
culée numériquement comme une fonction de deux limites. Ce pro- 
céde est très long et compliqué. Même si on arrive à trouver une 
approximation analytique pour la fonction sous l'intégrale, dans 
la majorité des cas l’intégrale (16.1.2) ne peut s’écrire à l’aide de fonc- 
tions connues. Il en est ainsi même pour les opérateurs de transfor- 
mation les plus simples. Si, comme c’est souvent le cas, le fonctionne- 
ment d'un système dynamique est décrit par des équations différentiel- 
les dont la solution ne peut s’exprimer sous forme explicite, la déter- 
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mination de la fonction de corrélation à la sortie est encore plus com- 
pliquée, car dans ce cas il y a lieu d’intégrer des équations différen- 
tielles aux dérivées partielles. 

C’est pourquoi, dans la pratique, les méthodes générales de trans- 
formation des fonctions aléatoires se trouvent être trop compliquées 
pour qu'il soit raisonnable de les employer. Dan“ les applications 
pratiques le plus souvent on utilise des méthodes conduisant à des 


X(t) X(t) 


T«p(t) 


Fig. 16.1.1 Fig. 16.1.2 


transformations plus simples. L'une de ces méthodes, proposée par 
V. Pougatchev et portant le nom de méthode des développements cano- 
niques, fait l'objet du présent chapitre. 

La méthode des développements canoniques repose essentielle- 
ment sur la représentation de la fonction aléatoire à transformer sous 
la forme d'une somme de fonctions aléatoires élémentaires. 

On appelle fonction aléatoire élémentaire une fonction de 
la forme: 


X (t) = Ve (à, (16.1.3) 


où Ÿ est une variable aléatoire, œ (f) une fonction non aléatoire. 

La fonction aléatoire élémentaire est la forme la plus simple des 
fonctions aléatoires. En effet, dans l’expression (16.1.3) seul le facteur 
V est aléatoire, tandis que la fonction du temps œ (é) ne l’est pas. 

Toutes les réalisations possibles de la fonction aléatoire élémen- 
taire X (£) peuvent être obtenues à partir de la courbe x = q (f) 
par changement d'échelle suivant l’axe des ordonnées (fig. 16.1.1). 
L'axe des abscisses (x = 0) se trouve être l’une des réalisations pos- 
sibles de la fonction aléatoire X ({), ce cas ayant lieu lorsque V = 0 
(si seulement zéro figure parmi les valeurs possibles de V). 

A titre d'exemples de fonctions aléatoires clémentaires citons 
X (t) = Vsint (fig. 16.1.2) et X (t) — Vt* (fig. 16.1.3). 

Les fonctions aléatoires élémentaires ont ceci de particulier que 
les deux propriétés essentielles des fonctions aléatoires s’y trouvent 
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séparées, le hasard n'intervenant que dans le coefficient V et la varia- 
tion dans le temps étant exprimée par une fonction certaine q (f). 

Déterminons les caractéristiques de la fonction aléatoire élémen- 
taire (16.1.3). On a: 


ms (t) = M (Ve (t)] = m,q (1), 


où m, est l'espérance mathématique de la variable aléatoire V. 
Si m; = 0, l'espérance mathématique de la fonction aléatoire 
X (t) est également nulle; de plus on a: 


mx (0 = 0. x() 


Toute fonction aléatoire peut être 
centrée, c'est-à-dire écrite sous une for- 
me telle que son espérance mathématique 
soit nulle. C’est pourquoi ultérieurement 
nous n'envisagerons que des fonctions aléa- 
toires élémentaires centrées pour lesquelles 
My =0; V=V;m.(t) = 0. 

Déterminons la fonction de corréla- 
tion d’une fonction aléatoire élémentaire 
X (t). On a: 

Ka (8, #)=M LX (1) X (= 

=op(t)p(t")MIV*1= 0 (t) p (+) D. Fig. 16.1.3 
où D est la variance de Y. 

Des fonctions aléatoires élémentaires se prétent facilement à 
diverses transformations linéaires. 

Dérivons, par exemple, la fonction aléatoire (16.1.3). La variable 


aléatoire V ne dépendant pas de ft doit être mise en facteur devant le 
signe de dérivation; on a alors: 


X' (à) = Vo’ (à. 


D'une manière analogue on a: 


ETEE p (t) dr. 


En général, si la fonction aléatoire élémentaire est transformée 
par un opérateur linéaire L, seule la fonction non aléatoire  (t) 
se trouve transformée par l'opérateur Z, le facteur aléatoire V, com- 
me indépendant du temps, devant être sorti du signe de l'opérateur : 


L'{X (t)} = VL {9 (t)}. (16.1.4) 
Ceci signifie que si une fonction aléatoire élémentaire est appliquée 


à l'entrée d’un système linéaire, seule la fonction non aléatoire 
œ (t) subit cette transformation. Ceci nous amène à l’idée de repre- 
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senter, exactement ou approximativement, la fonction aléatoire du 
type géncral attaquant l'entrée d'un système dynamique comme la 
somme de fonctions aléatoires élémentaires et seulement après la 
soumettre à la transformation. Cette idée de décomposition d’une 
fonction aléatoire en une somme de fonctions aléatoires élémentaires 
est à la base de la méthode des développements canoniques. 


Soit la fonction aléatoire : 
X(D=m.(0+ X (0. (16.1.5) 


Supposons que d'une manière exacte ou approximative, cette 
fonction puisse être écrite comme une somme : 


X (4) = m, (t) + 2 Vi (b), (16.1.6) 


où V; sout des variables aléatoires d'espérances mathématiques nul- 
les ; æ; (t) sont des fonctions non aléatoires; m, (t) est l'espérance 
mathématique de la fonction X (t). 

La formule (16.1.6) est le développement de la fonction aléatoire 
X (t). Les variables aléatoires Vi, V2, . .., V,, sont les coefficients 
du développement, et les fonctions non aléatoires w; (£), @2 ({), . .. 

.… Pm (t) les fonctions de coordonnées. 

Déterminons maintenant la réponse d'un système linéaire d’opé- 
rateur L à une action aléatoire X (t) donnée par le développement 
(16.1.6). On sait qu'un système linéaire est doué de la propriété 
de superposition qui consiste en ce que la réponse du système à une 
somme (le plusieurs actions est égale à la somme des réponses à chaque 
action particulière. En effet, étant linéaire, l'opérateur L du système 
peut, par définition, être appliqué à tous les termes séparément. 

Désignant par Ÿ ({) la réponse du système à l’action aléatoire 
X (t)ona: 


YO =L{X(D}=L{m(9}+ D VIL{(O}.  (16.1.7) 


Ecrivons l’expression (16.1.7) sous une forme un peu différente. 
Compte tenu de la règle de transformation linéaire de l'espérance 


mathématique on a: 
L'{m,(t)} = my (t). 


En introduisant la désignation : 


L {qu ()} = 1 (0), 


on obtient : 
Y (t)=my(t) + 2 Vabi (+). (16.1.8) 


L'expression (16.1.8) n'est rien d'autre que le développement de 
la fonction aléatoire Ÿ (f) suivant des fonctions élémentaires. Les 
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coefficients de ce développement sont les mêmes variables aléatoires 
Vi, V2, ..., V,, qu'en (16.1.6), tandis que l'espérance mathéma- 
tique et les fonctions de coordonnées sont obtenues à partir de l’es- 
pérance mathématique et des fonctions de coordonnées de la fonction 
aléatoire initiale moyennant la mème transformation L à laquelle 
a été soumise la fonction aléatoire X (6). 

On obtient donc la règle suivante de transformation des fonctions 
aléatoires données sous la forme d’un développement. 

Lorsque la fonction aléatoire X (t) donnée par un développement sui- 
vant les fonctions élémentaires est soumise à une transformation linéaire 
L, les coefficients du développement restent inchangés et l'espérance 
mathématique et les fonctions de coordonnées subissent la même transfor- 
mation linéaire L. 

Ainsi, l'avantage essentiel que présente la décomposition d’une 
fonction aléatoire en fonctions élémentaires est en ce qu'une trans- 
formation linéaire d’une fonction aléatoire se réduit aux mêmes 
transformations linéaires des fonctions non aléatoires, à savoir de 
l'espérance rasthématique et des fonctions de coordonnées. Ceci 
simplifie considérablement le problème de la détermination des carac- 
téristiques de la fonction aléatoire Ÿ (t) par rapport à la solution 
générale donnée au $ 15.7. En effet, chacune des fonctions non aléa- 
toires m,(t), œ (ft), eo (t), . . ., Pn (f) n’est transformée qu'une 
seule fois à la différence de la fonction de corrélation Æ,. (4, !”) qui, 
en vertu des règles générales, subit une double transformation. 


16.2. Développement canonique d’une fonction 
aléatoire 


Soit la fonction aléatoire X ({) donnée par le développement : 


X (4) = ma (t) + È Viqi (t), (16.2.1) 


où les coefficients V,, V2, ..., V, forment un système de variables 
aléatoires d’'espérances mathématiques nulles et de matrice de corré- 
lation || K;; ||. 

Cherchons la fonction de corrélation et la variance de la fonction 
aléatoire X (4). 

Par définition on a: 


| K.(t,t)>=MIX(t) X(#)1, (16.2.2) 
ou 
X (= 5 Viqi(é), (16.2.3) 


X(t)= à Vo(t'). (16.2.4) 
2= 
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Dans la formule (16.2.4) l’indice de sommation est désigné par 
j, ceci pour souligner son indépendance de l'indice de sommation à 
dans la formule (16.2.3). 

En multipliant les expressions (16.2.3) et (16.2.4) et en appliquant 
l'opération d'espérance mathématique au produit an obtient : 


K;(t,t)=M [2 ViViqi(t)p,(t")] = 
2 M [VV] qu (t) qs(t”), (16.2.5) 


où la sommation s'étend à tous les couples de valeurs i, j, qu'elles 
soient égales entre elles ou non. Dans le cas où i — jona: 


MIViV]=M[Vi=Ky= Di, 
D, étant la variance de la variable aléatoire V;. Quand i Æ j, on a: 
M (ViVil = Ki, 


Ki; étant la covariance des variables aléatoires V;, V;. 

Substituons ces valeurs dans la formule (16.2.5), on obtient l'ex- 
pression de la fonction de corrélation de X({) donnée par le développe- 
ment (16.2.1), il vient: 


K,(t, t")= 2 qi (£) pi (£”) D: + 2 (t)p;()K;;. (16.2.6) 


En posant !’ — t dans l'expression (16.2.6) on obtient la variance 
de la fonction aléatoire X (4): 


D, (t) = 2 [pi (Di + À Pa (e) Fit) Kis- (16.2.7) 


11 est évident que les expressions (16.2.6) et (16.2.7) deviennent 
particulièrement simples lorsque tous les coefficients V, du déve- 
loppement (16.2.1) ne sont pas corrélés, c’est-à-dire ÆA';, = 0 pour 
= j. Dans ce cas le développement de la fonction aléatoire est dit 
canonique. 

On appelle développement canonique de la fonction aléatoire 
X (t) sa représentation sous la forme: 


X(t)=m;(t) + 2 Vip; (t), (16.2.8) 


où m, (1) est l'espérance mathématique de la fonction aléatoire; 
Qu (4), P2 (£), - - -, Pm (t) les fonctions de coordonnées, et V,, V2, . .. 
..… Vn des variables aléatoires non corrélées d’espérances mathé- 
matiques nulles. 
Si l’on connaît le développement canonique d’une fonction aléa- 
toire, sa fonction de corrélation s'exprime d’une manière fort simple. 
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En posant K;; = 0 pour i £ j dans la formule (16.2.6) on obtient: 
K,(t, t)— 2 pa (e) pi (8) Di. (16.2.9) 


L'expression (16.2.9) est appelée développement canonique de la 
fonction de corrélation. 


En posant &”’ — ? dans la formule (16.2.9) on obtient la variance 
de la fonction aléatoire: 


D, (t) = à [ps (€)]7 Ds. (16.2.10) 


Ainsi, connaissant le développement canonique de la fonction 
aléatoire X (f) on peut trouver directement le développement canoni- 
que de sa fonction de corrélation. On peut montrer que l'inverse est 
également vrai, à savoir si.le développement canonique de la fonc- 
tion de corrélation (16.2.9) est donné, le développement canonique 
de la fonction aléatoire X (f) sera de la forme (16.2.8) avec les fonc- 
tions de coordonnées ®; (£) et les coefficients V, de variances D,. Nous 
laissons cette assertion sans démonstration spéciale *). 

Le nombre de termes du développement canonique d’une fonction 
aléatoire peut être tant fini qu'infini. Dans le chapitre 17 nous ren- 
contrerons des exemples de développements canoniques à un nombre 
infini de termes. De plus dans certains cas on utilise des représenia- 
tions canoniques intégrales des fonctions aléatoires, où la somme 
est remplacée par une intégrale. 

Les développements canoniques peuvent être appliqués aussi 
bien aux fonctions aléatoires réelles qu'aux fonctions complexes. 
Voyons comment on peut généraliser la notion de développement 
canonique au cas des fonctions aléatoires complexes. 

On appelle fonction élémentaire complexe une fonction de la 
forme : 


X (à = Vo (#, (16.2.11) 


où la variable aléatoire V et la fonction œ (t) sont complexes. 
Déterminons la fonction de corrélation de la fonction aléatoire 

élémentaire (16.2.11). En utilisant la définition générale de la fonc- 

tion de corrélation d'une fonction aléatoire complexe on obtient: 


K;:(t,t)=M{[Ve(t)Vo(t)], (16.2.12) 


où le trait indique comme auparavant une grandeur complexe conju- 
guée. Compte tenu de 


Vo (t) = Vo (i) 
*) Pour la démonstration voir: V. Pougatchev. Théorie des fonctions alca- 


toires et ses applications aux problèmes de la commande automatique (en russe). 
Fizmathguiz, Moscou, 1962 
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et en mettant en facteur devant le signe de l'espérance mathéma- 
tique les fonctions certaines œ (£) et œ ({’) on obtient : 
K:( t)=ç(t)et)MIIVF. 
Mais en vertu du $ 15.9, le terme 47 [ [V |*] n'est rien d'autre que 
la variance de la variable aléatoire complexe Ÿ, donc: 
M||V ]= D, 


par conséquent : 
K,(4,.2) = (ti) y (t) D. (16.2.13) 


Le développement canonique d’une fonction aléatoire complexe 
s'écrit sous la forme: 


X(t)=m,(t)+ À Viqi(e), (16.2.14) 

1=1 
où Vi, Vs, ..., V,, sont des variables aléatoires complexes non cor- 
rélées d’espérances mathématiques nulles, et m., (£), qi (t), @2 (t),... 


...+ Pm (t) des fonctions non aléatoires complexes. 
Si une fonction aléatoire complexe est donnée par le développe- 
ment canonique (16.2.14), sa fonction de corrélation s'écrit : 


Ke(t)= 2 gif qi) Di. (16.2.15) 
où D, est la variance de V,: _ 
Di=M{|V;f1. (16.2.16) 


La formule (16.2.15) découle directement de l'expression (16.2.13) 
pour la fonction de corrélation d’une fonction aléatoire élémentaire 
complexe. 

L'expression (16.2.15) est appelée développement canonique de la 
fonction de corrélation d'une fonction aléatoire complexe. 

Posant £&” = { dans (16.2.15) on obtient l'expression de la variance 


d'une fonction aléatoire complexe donnée par le développement 
(16.2.14) : 


D, (t)= 2 | qi (t)  D:. (16.2.17) 


16.3. Transformations linéaires des fonctions 
aléatoires données par leurs développements 
canoniques 
Soit la fonction aléatoire X (t) appliquée à l'entrée d’un système 
linéaire L (fig. 16.3.1). 
Le système fait subir à la fonction X (£) la transformation linéaire 
L de sorte qu'on obtient à la sortie la fonction aléatoire: 


Y (D =L{X (0}. (16.3.1) 
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Supposons que la fonction aléatoire X ({) soit donnée par son 
développement canonique: 


k 
X(t)=m,.(t) + Ù Viqui(r). (16.3.2) 
ES | 


» 


Déterminons la réponse du système à cette action. L'opérateur 
du système étant linéaire, on a: 


R 
Y(=L{X(}=L(m(D}+ D ViL(q(E}. (163.3) 


Il est facile de voir que l’expression (16.3.3) n'est rien d'autre que 
le développement canonique de la fonction aléatoire Y (t) dont l'espé- 


a 
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Fig. 16.3.1 


rance mathématique est: 


my(t) = L{m,(t)} (16.3.4) 
et les fonctions de coordonnées sont : 
ÿ (4) = L {qu (0) }. (16.3.5) 


À insi lors d'une transformation linéaire du développement canonique 
de la fonction aléatoire X (t) on obtient le développement canonique 
de la fonction aléatoire Y (t), l'espérance mathématique et les fonctions 
de coordonnées étant soumises à la même transformation. 

Si une fonction aléatoire Ÿ (t) s'obtient à la sortie d'un système 
linéaire sous la forme d’un développement canonique: 


Y (t)=m, (t) - 2 Vi (2), (16.3.6) 


sa fonction de corrélation et sa variance se déterminent facilement 
par les formules: | 


R 

K, (t,t') = À vw (4) bi (4')D,, (16.3.7) 
R 

D,(t)= 2 lbs (2) Di. (16.3.8) 


C'est là l'avantage essentiel des développements canoniques 
par rapport aux autres modes de développement suivant des fonctions 
élémentaires. | 
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Examinons plus en détail l'application de la méthode des déve- 
loppements canoniques au calcul de la réponse d’un système dynarmi- 
que à une action aléatoire d'entrée, dont le fonctionnement est 
décrit par une équation différentielle linéaire, dans le cas général, 
à coefficients variables. Ecrivons cette équation sous la forme opé- 


rationnelle : 
A, (p, D)Y (8 = B, (p, t) X (D. (16.3.9) 


En vertu des règles des transformations linéaires des fonctions 
aléatoires exposées ci-dessus, les espérances mathématiques de l’ac- 
tion et la réponse doivent satisfaire à la même équation: 


An(p, Dm, (5 = Bu (p, tm, (. (16.3.10) 


D'une manière analogue, chacune des fonctions de coordonnées 
doit vérifier la même équation différentielle: 


An (pP, D) = Bip, D mt), (i = 1, 2, ..., k). (16.3.11) 


Ainsi, le problème de la détermination de la réponse d'un système 
dynamique linéaire à une action aléatoire se réduit au problème 
mathématique courant de l'intégration de 4 + 1 équations différen- 
tielles ordinaires contenant des fonctions non aléatoires. Comme le 
problème fondamental de l'analyse d’un système dynamique, qui 
consiste dans la détermination de la réponse à une action donnée, 
nécessite l'intégration de l'équation différentielle décrivant le fonc- 
tionnement du système, et que cette intégration est faite selon une 
méthode ou une autre, la résolution des équations (16.3.10) et 
(16.3.11) n’entraîne pas de nouvelles difficultés mathématiques. En 
particulier, pour la résolution de ces équations on peut utiliser les 
mêmes dispositifs intégrateurs ou simulateurs que ceux dont on se 
sert dans l'analyse du fonctionnement des systèmes sans perturba- 
tions aléatoires. 

Il ne reste plus qu’à élucider les questions relatives aux conditions 
initiales pour lesquelles il faut intégrer les équations (16.3.10) et 
16.3.11). 
| allons étudier tout d’abord le cas le plus simple lorsque les 
conditions initiales pour le système dynamique considéré ne sont pas 
aléatoires. Dans ce cas pour t = 0 on doit avoir les conditions sui- 


vantes : 
Y (0) = Yo; 
Y" (0) = y, | 
SR TR ER 6.3.42 
YO (0) = y, | (16.3.12) 


Y®-D (0)= y ) 
OÙ Yo Yiy + + + Yn-1 SOnt des nombres non aléatoires. 
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Les conditions (16.3.12) peuvent être écrites sous une forme con- 
densée comme : 


YN(0)=y. (r=0,1,...,n—1), (16.3.13) 


la « dérivée d'ordre zéro » Y‘® (f) étant ici la fonction Y (4). 
Cherchons les conditions initiales pour lesquelles il y a lieu d'in- 
tégrer les équations (16.3.10) et (16.3.11). Ecrivons la dérivée d'ordre 
r de la fonction ŸY (t) en posant ?{ = 0: 
k 
Y (0)= mt? (0)+ D) Va (0). 
is! 


Compte tenu de (16.3.12) on a: 


kR 
m{r) (0) +- 2 Va( (0) = yr. (16.3.14) 


La grandeur y, n'étant pas aléatoire, la variance du premier 
membre de (16.3.14) doit être nulle: 


R 
21 Dit” (0)? = 0. (16.3.15) 


Toutes les variances D, des variables V, étant positives, l'égalité 
(16.3.15) ne peut avoir lieu que si 
(7) (0) —0 (16.3.16) 
pour tous les i. 
En substituant 4° (0) = 0 dans la formule (16.3.14) on obtient: 
my (0)= ur. (16.3.17) 


L'égalité (16.3.17) montre que l'équation (16.3.10) pour l'espé- 
rance mathématique doit être intégrée pour les conditions initiales 
(16.3.12), à savoir: 


my (0) = Yo; 
my (0) = yr; | 
ma (O)=yr | (16.3.18) 


mi (0) = yn- | 
Quant aux équations (16.3.11), elles doivent être intégrées pour 
des conditions initiales nulles: 
4: (0) =; (0) = . .. — (9 (0) =... = {9 (0) —0 (i=1,2,...,k). 
(16.3.19) 
26—2823 
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Envisageons maintenant le cas plus compliqué où les conditions 
initiales sont aléatoires, 


Y (0) _— Yo | 
Y'(0)=Ÿ4, 


(16.3.20) 


Y* (0) = nr 


Yo 19 + + + Y'n-1 étant des variables aléatoires. 
Dans ce cas la réponse du système s'obtient sous la forme d'une 
somme : 


Y (0 = Y1 (0 + Yu (6, (16.3.21) 


où Yr(é) est la solution de l'équation différentielle (16.3.9) pour 
des conditions initiales nulles et Y'11 (f) la solution de cette même 
équation différentielle pour le second! membre nul et les conditions 
initiales (16.3.20). La théorie des équations différentielles nous 
apprend que cette solution doit être une combinaison linéaire des 
conditions initiales, à savoir 


n—1 
Y'r1 (4) = À Y'if; (E), (16.23.22) 


{; (€) étant des fonctions non aléatoires. 

La solution Yr(t) peut être obtenue par la méthode exposée 
ci-dessus sous la forme d’un développement canonique. La fonction 
de corrélation de la fonction aléatoire ŸY (4) = Y'r1 (6) + Yu (t) se 
détermine par les méthodes habituelles d’'addition des fonctions alca- 
toires (voir $ 15.8). 

Notons que souvent dans la pratique pour des instants suffisam- 
ment éloignés de l'origine du processus aléatoire, les conditions ini- 
tiales n’ont aucune influence sur le cours du processus, car les pro- 
cessus transitoires engendrés par celles-ci ont le temps de s’amortir. 
Les systèmes doués de cette propriété sont dits asymptotiquement 
stables. Si l’on s'intéresse à la réponse d’un système dynamique asymp- 
totiquement stable sur les intervalles de temps suffisamment éloi- 
gnés de l’origine, on peut se limiter à la solution Yi (4) obtenue pour 
des conditions initiales nulles. Pour des instants suffisamment éloi- 
gncs de l'instant initial cette solution sera vraie pour des conditions 
initiales quelconques. 


CHAPITRE 17 


FONCTIONS ALÉATOIRES STATIONNAIRES 


17.1. Notion de processus aléatoire stationnaire 


Dans la pratique on rencontre souvent des processus aléatoires 
se déroulant dans le temps d’une manière à peu près homogène et 
ressemblant à des oscillations aléatoires continues autour d'une cer- 
taine valeur moyenne, ni l’amplitude moyenne, ni le caractère de 
ces oscillations ne subissant de variations importantes dans le temps. 
Ces processus aléatoires sont dits s{ationnaires. 


Fig. 17.1.1 


A titre d'exemple de processus alcatoires stationnaires on peut 
citer : 1) les vibrations d'un avion en régime stable de vol horizontal; 
2) les oscillations de la tension dans un réseau électrique ; 3) les bruits 
aléatoires dans un récepteur radio; 4) le ballottement d'un navire, etc. 

Un processus stationnaire peut être considéré comme se déroulant 
infiniment longtemps; lors de l'étude d'un processus stationnaire 
le choix du moment initial importe peu. Les caractéristiques d’un 
processus stationnaire doivent étre les mêmes, quel que soit l’inter- 
valle de temps qu'on choisit pour étudier le processus. D'une façon 
imagée on peut dire qu’un processus aléatoire «n’a ni commencement 
ni fin ». 

Par exemple, la variation de la hauteur du centre de gravité 
d'un avion en régime stable de vol horizontal est un processus aléa- 
toire stationnaire (fig. 17.1.1). 


26 


404 FONCTIONS ALBATOIRES STATIONNAIRES (CH. 17 


A l'opposé des processus stationnaires on peut citer des proces- 
sus nettement non stationnaires, par exemple, les vibrations d'un 
avion en régime de plongée ; les oscillations amorties dans un circuit 
électrique ; la combustion de la charge propulsive dans une chambre 
de propulsion, etc. Un processus non stationnaire accuse toujours 
une certaine tendance de développement dans le temps; les caracté- 

ristiques d'un tel processus 
R(1) dépendent de l'origine et 
du temps. 

Sur la figure 17.1.2 on 
peut voir une famille de 
réalisations d'un processus 
aléatoire manifestement 
non stationnaire, il s’agit 

t du processus de variation 
dans le temps de la poussée 
Fig. 17.1.2 d’un moteur. 

I1 y a lieu de noter qu'il 

existe des processus aléatoi- 
res manifestement non stalionnaires qui ne lesont pas durant le cours 
de leur développement. Dans certains intervalles de temps ou avec 
une certaine approximation ils peuvent être considérés comme 
stationnaires. 

En général tout processus aléatoire dans tout système dynamique 
commence par une phase non stationnaire appelée « processus transi- 
toire ». Après l'amortissement du processus transitoire le système 
passe en général à un régime stable, les processus aléatoires s'y dé- 
roulant alors peuvent ctre considérés comme stationnaires. 

Dans les applications physiques et techniques on rencontre très 
souvent des processus aléatoires stationnaires. De par leur nature 
ces processus sont plus simples que les processus non stationnaires 
et ainsi plus simples sont les caractéristiques les décrivant. Les 
transformations linéaires des processus aléatoires stationnaires sont 
également plus faciles à réaliser que dans le cas des processus non sta- 
tionnaires. C’est pourquoi très employée en pratique est la théorie 
spéciale des processus aléatoires stationnaires ou plus exactement la 
théorie des fonctions aléatoires stationnaires, car l'argument d'une fonc- 
tion aléatoire peut dans le cas général être autre que le temps. 


» 


Le présent chapitre est consacré à un bref exposé de cette 
thcorie. 

Une fonction aléatoire X (f) est dite stationnaire si toutes ses 
propriétés statistiques sont invariantes dans tout changement de 
l'origine des temps. 

Dans notre exposé élémentaire de la théorie des fonctions alcatoi- 
res nous ne faisons pas appel à des lois de probabilité, en nous limi- 
tant uniquement à l'espérance mathématique, à la variance et à 
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la fonction de corrélation. Nous allons donc définir une fonction aléa- 
toire stationnaire en nous basant sur ces caractéristiques. 

Une fonction aléatoire stationnaire devant varier d'une manière 
homogène dans le temps, il est tout naturel de demander que l'espé- 
rance mathématique d’une fonction aléatoire stationnaire soit cons- 
tante 

Max ({) = M, = const. (17.1.1) 


Il y a lieu cependant de noter que cette condition n’est pas essentielle ; 
en effet, on peut toujours passer de la fonction aléatoire X (£) à la 


fonction aléatoire centrée X (t) dont l'espérance mathématique est 
identiquement nulle et par conséquent satisfait à la condition 


JA 
CS m\ 
= [) be 
JO / LIN éers 
/ re 
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Fig. 17.1.3 


(17.1.1). Ainsi, si un processus aléatoire n est pas stationnaire que 
parce que son espérance mathématique est variable, ceci ne nous 
empêchera pas de l'étudier comme un processus stationnaire. 

Une fonction aléatoire stationnaire doit également satisfaire à une 
seconde condition, à savoir sa variance doit être constante : 


D, (t) = D, = const. (17.1.2) 


Essayons d'établir la condition à remplir par la fonction de corré- 
lation d’une fonction aléatoire stationnaire. Soit une fonction aléatoi- 
re X (t) (fig. 17.1.3). Dans l'expression de X,(f, {’) posons {” — 
= t+ vet soit K,{(f, t + t) la covariance de deux sections de la 
fonction aléatoire séparées par l’intervalle de temps +. Il est évident 
que si le processus aléatoire X (f) est réellement stationnaire, cette 
covariance ne doit pas dépendre de l'origine des temps mais seule- 
ment de la longueur de cet intervalle. Par exemple, pour les domaines 
I et IT sur la figure 17.1.3 de même longueur, les valeurs K, (1, t +- 
+ +) et K, (41, 4 + +) de la fonction de corrélation doivent être 
les mêmes. D'une façon générale, la fonction de corrélation d'un 
processus aléatoire stationnaire doit satisfaire à : 


K,(,t+r =k, (x). (17.13) 


Ceci signifie que la fonction de corrélation d’un processus aléatoi- 
re stationnaire est une fonction non pas de deux mais d’un seul aryu- 
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ment, ce qui simplifie beaucoup les opérations sur les fonctions aléa- 
loires stalionnaires. 

Il faut noter que la condition (17.1.2) exigeant que la variance 
d'une fonction alcatoire stationnaire soit constante est un cas parti- 
culier de (17.1.3). En effet, en posant dans la formule (17.1.3) t + 
+ + = {(Tt — 0) on a 


D,(t = K,(t, t) = k, (0) = const. (17.1.4) 


Ainsi, (17.1.3) est l’unique condition essentielle imposée à une fonc- 
tion aléatoire stationnaire. 

Dans l'exposé ultérieur nous entendrons par fonction aléatoire 
stationnaire une fonction alcatoire telle que sa fonction de-corréla- 
tion dépende non pas de deux arguments ! et {’ mais seulement de 


Az (F] 


Dr 


Fig. 17.1.4 


l'intervalle les séparant. Pour ne pas imposer de conditions spécia- 
les à l'espérance mathématique, nous n'envisagerons que des fonctions 
aléatoires centrées. 

On sait que la fonction de corrélation d'une fonction aléatoire est 
symétrique : 


K,.(t, t) = K,(t, b. 
Posant #” — t{ = x on obtient pour un processus stationnaire : 
ke (t) = kx (—T), (17.1.5) 


c'est-à-dire que la fonction de corrélation X, (+) est une fonction paire. 
C'est pourquoi on se borne en général à définir la fonction de corré- 
lation pour les valeurs positives de son argument (fig. 17.1.4). 

Dans la pratique on utilise couramment au lieu de la fonction 
de corrélalion k, (t) la fonction de corrélation normée : 


Ps -®, (17.1.6) 
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où D, = k, (0) est la variance constante du processus stationnaire. 
La fonction p. (t) n’est rien d’autre que le coefficient de corrélation 
entre les sections de la fonction aléatoire, séparées par un laps de 
temps égal à t. Il est évident que l’on a p, (0) = 1. 

À titre d'exemple nous considérons deux échantillons de proces- 
sus aléatoires approximativement stationnaires et nous déterminons 
leurs caractéristiques. 


Exemple 1. La fonction aléatoire X (t) est donnée par un ensemble 
de 12 réalisations (fig. 17.1.5). On demande de trouver: a) ses caractéristiques 
mx (t), K,(f, #”), D, (t) et la fonction de corrélation normée r, (t, t”); b) les 
mêmes caractéristiques en supposant X (f) approximativement stationnaire. 


Lof*{t) à | | | __ zi{t) 
, ee ,T6(t) 
0, Mr 


Fig. 17.1.5 


Solution. Comme la fonction aléatoire X ({) varie d'une manière 
relativement continue, les sections peuvent être relativement espacées, par 
exemple toutes les 0,4 s. Dans ce cas la fonction aléatoire se réduira à un syste- 
me de sept variables aléatoires correspondant aux sections t — 0; 0,4; 0,8; 
1,2; 1,6; 2,0; 2,4. En marquant ces sections sur Île graphique on lit les valeurs 
de X (t) dans ces sections et on établit le tableau des valeurs relevées (tableau 
17.1.1). 

I1 cest recommandé de remplir ce tableau ligne par ligne en se déplaçant 
tout le temps le long d’une même réalisation. 

Puis on trouve les estimations des caractéristiques des variables aléatoires 
X (0), X (0,4), ..., X (2,4). En prenant la somme des colonnes et en divisant 
cette samme par le nombre de réalisations n — 12 on trouve approximative- 
ment l'espérance mathématique en fonction de temps: 


t | 0 | 0,4 [0,8 | 1,2 | 16 | 20 | 2,4 
mn (0 1 —0,007 | —0,057 | 0,000 | 0,037 | —0,057 | —0,093 [0,036 


Sur le graphique de la fig. 17.1.5 l'espérance mathématique est représentér 
en trail gras. 
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Tableau 17.1.1 


n° de 0 0, 0,8 | DA 1,6 2,0 2,1 

réalisation 
| 0,64 0,741 0,62! 0,59| 0,351—0,09 | —0,39 
2 0,54 0,37| 0,06] —0,32|—0,60 | —0,69 | —0,67 
3 0,34 0,50! 0,37] 0,26|—0,521—0,72| 0,42 
4 0,23 0,26| 0,35] 0,55] 0,69! 0,75] 0,80 
5 0,12] 0,20| 0,24 0,18 |—0, —0,42 | —0,46 
(ÿ —0,16|[—0,121—0,15| 0,05] 0,29] 0,43 63 
7 —0.22|—0,29|—0,381—0,241—0,06| 0,07] —0,16 
8 —0,26| —0,691—0,70| —0,61|—0,431—0,22| 0,29 
9 —0,50 | —0,60 |—0,68 | —0,621—0,68 |! —0,56 | —0,54 
10 —0,30| 0,13] 0,75] 0,84| 0,78| 0,73| 0,71 
11 —0,69!/—0,40! 0,081 0,16| 0,12] 0,18| 0,33 
12 0,148| —0,791—0,56 | —0,391—0,42 | —0,58| —0,53 


Ensuite on trouve les estimations des éléments de la matrice de corréla- 
tion, à savoir des variances et des covariances. Le plus simple est de procéder 
comme suit. Pour le calcul de la variance statistique on prend la somme des 
carrés des nombres par colonne, on divise cette somme par r = 12 et on re- 
tranche du résultat le carré de l'espérance mathématique correspondante. l’oui: 
trouver l'estimation centrée le résultat doit être multiplié par le terme correc- 


teur — — = . Les covariances sont estimées d’une manière analogue. Pour 


le calcul du moment statistique correspondant à deux sections données il y 
a lieu de multiplier entre eux les nombres se trouvant dans les colonnes respec- 
tives, de faire la somme algébrique des produits, de diviser par nr — 12 la somme 
obtenue et de retrancher du résultat le produit des espérances mat'iématiques 
correspondantes. L’estimation centrée de la covariance s'obtient en multipliant 


. Lorsque les calculs sont effectués à l'aide d’une machine 


, n 
le résultat par pp 


à calculer, les produits intermédiaires ne sont pas portés dans le tableau, mais 
s'ajoutent au total accumulé *). La matrice de corrélation du système des 
variables aléatoires X (0), X (0,4), - .., X (2,4) est donnée dans le tableau 
17.1.2. C’est également le tableau des valeurs de la fonction de corrélation 
R, (4, t'). 

Suivant la diagonale principale on trouve les estimations des variances: 


UN RS RU RNCS 


D, (9 |0,1632]| 0,2385 | 0,2356 | 0,2207 | 0,2407 | 0,2691 | 0,2878 


*) Dans le cas présent il s’est trouvé possible d'effectuer le traitement 
directement à l’aide des moments initiaux, car l'espérance mathématique de 
la fonction X (f) est voisine de zéro. Dans le cas contraire il y a lieu, avant 
de commencer le traitement, de transférer l'origine dans le voisinage de l'espé- 
rance mathématique. 
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Tableau 17.1.2 


0 0,1632 | 0,1379| 0,0795 | 0,0457 |—0,0106 |—0,0642 |—0,0648 
0,4 ; , 0,1621 0,082 0,0229 | 0,0251 
0,8 0,2356 | 0,2152 | 0,1527 | 0,0982 | 0,089% 
1,2 0,2207 | 0,1910 | 0,1491 | 0,1322 
1,6 0,2407 ; 0,1711 
2,0 0,2691 | 0,2114 
2,4 0,2878 


L 1 


En prenant la racine carrée de ces grandeurs on trouve l'écart quadratique 
moyen ©, en fonction du temps: 
t | o |0,4 | 0,8 | 1,2 | 1,6 | 2,0 | 2,4 
6x (4) [0,404 | 0,488 | 0,485 | 0,470 | 0,491 | 0,519 | 0,536 


En divisant les valeurs se trouvant dans le tableau 17.1.2 par les produits des 
écarts quadratiques moyens correspondants, on obtient le tableau des valeurs 


de la fonction de corrélation normée Tr (4, t’) (tableau 17.1.3). 
Tableau 17.1.3 


0 1 0,700 | 0,405 0,241 | —0,053 | —0,306 | —0,299 
0,4. 1 0,856 0,707 0,345 0,090 0.095 
0,8 1 0,943 0,643 0,390 0,344 
140 1 0,829 0,612 0.524 
1,6 1 0,923 0,650 
2,0 1 0,760 
2,4 1 


Nous allons voir à quel point Ja fonction aléatoire X (t) est stationnaire. 
A première vue les résultats de traitement ne permettent pas de conclure que 
la fonction aléatoire X (f) est stationnaire. En effet, son espérance mathéma- 
tique n'est pas rigoureusement constante, sa variance change également un peu 
dans le temps, les valeurs de la fonction de corrélation normée suivant les paral- 
lèles à la diagonale principale ne sont pas constantes non plus. Mais vu que 
le nombre de réalisations traitées n’est pas important (nr — 12) et que les esti- 
mations obtenues dépendent donc fortement du hasard, on ne doit pas considérer 
les écarts observés comme importants, surtout qu'ils n’accusent pas de régu- 
larité. C'est pourquoi il est raisonnable de remplacer la fonction aléatoire X (r) 
par une fonction stationnaire. Pour trouver cette fonction aléatoire stationnaire 
approchée, nous allons calculer la moyenne temporelle de l’estimation de l’es- 
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pérance mathématique: 


Ms = Mz (0) +mz (0,4) ms se + mx (2,4) ze — 0,02, 


D'une manière analogue on prend la moyenne de la variance: 


D, = 2e 0 +2s OF + Dr (2,4) = 0,236. 


En extrayant la racine carrée on trouve la moyenne de l'estimation de l'écart 
quadratique moyen: 


, Re (t) 6. = 0,486. 


? Cherchons maintenant la fon- 
ction de corrélation normée du pro- 
cessus stationnaire pouvant servir 
d'approximation à la fonction X (t). 
Pour un processus stationnaire la fonc- 
tion de corrélation (donc également 
la fonction de corrélation normée) ne 
dépend que de t = {” — +; par consé- 
quent, pour + constant la ‘fonction de 

T corrélation doit être constante. Selon 

0 ! J le tableau 17.1.3 à la condition 

+ = const satisfont la diagonale prin- 

cipale (t = 0) et les parallèles a cette 

diagonale (t = 0,4; t = 0,8; t=— 1,2, 

etc.). En prenant la moyenne des esti- 

mations de la fonction de corrélation 
le long de ces parallèles à la diagonale principale on obtient la valeur de la 


fonction p P+ (T) : 


Fig. 17.1.6 


co fosfosfielss) ze [es 2,0 | 2,4 


RENE) 00 Loue loto Louss ou | oo | 00 


Le graphique de la fonction p. (rt) est donné sur la figure 17.1.6. 

En l’examinant on remarque que pour certaines valeurs de + la fonction 
de corrélation est négative. Ceci traduit une certaine périodicité dans la struc- 
ture de la fonction aléatoire, entraînant sur l'intervalle égal à peu près à la 
moitié de la période des oscillations fondamentales une corrélation négative 
entre les valeurs de la fonction aléatoire : à des écarts positifs par rapport à la 
moyenne dans une section .correspondent des écarts négatifs dans une autre 
section distante de la première d’un certain intervalle de temps, et inversement. 
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Dans la pratique on rencontre assez souvent des fonctions de corrélation 
à valeurs négatives. Généralement dans ces cas, au fur et à mesure de l’augmen- 
tation de +, l'amplitude des oscillations de la fonction de corrélation diminue 
et pour des + grands la fonction de corrélation tend vers zéro. 


LOIXIE  ,  , 


\ 
"= (ir /1/\ 


ZNX CA) SE à F0 
NASA = ou EX 
. NY } (Ci 
Exemple 2. La fonction aléatoire X (t) est donneé par un ensemble 


de 12 réalisations (fig. 17.1.7). En approchant la fonction X (t) par une 
fonction stationnaire comparer la fonction de corrélation normée de cette 


dernière avec la fonction p- (rt) de l’exemple précédent. 

Solution. Comme la fonction aléatoire X (t) varie d'une manière bien 
moins continue que la fonction X (f) de l’exemple précédent, l'intervalle entre 
les sections ne peut plus être choisi égal à 0,4 s comme dans l'exemple précédent, 
mais au moins deux fois plus petit (par exemple, 0,2 s comme sur la figure 17.1.7). 
Le dépouillement des données fournit l'estimation de la fonction de corrélation 


normeë p. (t): 


0 


.2/0.4[0,| 0,8 | 1,0 | 1,2 | 1,4 | 1,6 | 1,8 [20/22/24 


Pr) 00,rh0,1.22|-0,o]-0.20)-0,19010)-0.08|-0,1h.08. 190,6 


Sur la figure 17.1.8 on a représenté le graphique de la fonction p. (1). En 
comparant les courbes des figures 17.1.8 et 17.1.6 on voit que celle de la figu- 
re 17.1.8 décroît plus rapidement. Ce résultat est tout naturel, car l’allure de la 
fonction X (t) dans l'exemple 1 est bien plus douce que dans l'exemple 2; par 
conséquent, la corrélation entre les valeurs de la fonction aléatoire de l'exemple 
1 décroît plus lentement. 
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Ce qui frappe dans la courbe de la figure 17.1.8 c’est des oscillations inat- 


tendues de la fonction p, (+) pour des + grands. Mais remarquant que pour des 
valeurs importantes de t les points de la courbe sont obtenus à partir d'un 


Fig. 17.1.8 


nombre relativement restreint de données, on doit les considérer comme appro- 
ximatifs. Dans ce cas il semble bon de procéder à un lissage de la fonction de 
corrélation comme ceci est montré en pointillé sur la figure 17.1.8. 


17.2. Développement spectral d’une fonction 
aléatoire stationnaire sur un intervalle 
de temps fini. Spectre des variances 


Les deux exemples donnés dans le paragraphe précédent montrent 
qu'il existe un lien entre la structure interne du processus aléatoire 
et l'allure de la fonction de corrélation correspondante, cette dernière 
dépendant fortement de la composition et des fréquences de la fonc- 
tion aléatoire. Ceci nous amène directement à la notion de composition 
spectrale d'une fonction aléatoire. 

La notion de « spectre » apparaît non seulement dans la théorie 
des fonctions aléatoires ; on la rencontre également en mathématiques, 
en physique et en technique. 

Si un certain processus oscillatoire se présente comme la somme 
d’oscillations harmoniques de différentes fréquences (d’harmoniques), 
son spectre est la fonction donnant la répartition des amplitudes aux 
différentes fréquences. Le spectre indique quelles sont les oscillations 
qui dominent dans le processus étudié et quelle est sa structure 
interne. 

De même on peut parler du spectre d'un processus aléatoire sta- 
tionnaire ; seulement les amplitudes des oscillations seront des varia- 
bles aléatoires. Le spectre d’une fonction aléatoire stationnaire 
décrira la répartition des variances suivant les fréquences. 

Nous allons maintenant aborder la notion de spectre d’une fonc- 
tion aléatoire stationnaire à partir des raisonnements suivants. 
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Considérons la fonction aléatoire stationnaire X (£) observée 
sur l'intervalle (0, T) (fig. 17.2.1) et soit la fonction de corrélation 


Fig. 17.2.1 


de la fonction aléatoire X (t): 
K,(t,t+Tt) = k, (x). 
La fonction k, (t) étant une fonction paire: 
k, (t)=#k;(—1), 


sa courbe est symétrique (fig. 17.2.2). 
Lorsque £ et {” varient de 0 à T, l'argument t = {’ — { varie de 
—Tà+T. 


KZ (©) 


Une fonction paire peut, sur l'intervalle (—7T, T), être dévelop- 
pée en série de Fourier à l’aide des seuls harmoniques pairs (cosinus) : 


k, (T) À D, cos ont, (17.2.1) 


Où = kO! ; x | (17.2.2) 
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les coefficients D, étant donnés par les formules : 
T 
1 
Do = 37 | k, (x) dx, 
2T 


- | (17.2.3) 
Di=+ | k, (T) cos œw,t dt pour k Æ 0. 
2T 
Les fonctions Æ, (rt) et cos w:Tt étant les fonctions paires, on peut 
écrire comme suit les formules (17.2.3) : 


T 
De= + | Ke (r) dr, 
0 


_ (17.2.4) 


D; = + | k,(t) cos wt dt pour k=£ CO. 
Ô 


Passons dans l'expression (17.2.1) de la fonction de corrélation 
k, (rt) de l’argument + à deux arguments ft et {’. A cet effet posons: 


COS GOT = COS O (£”— 1) = cosw,t’ cosw,t +sino,t’sinogt (17.2.5) 


et portons (17.2.5) dans la formule (17.2.1): 
K,(t,t"}= ÿ, (Drcoso,t’ cosut + Disinont’ sin ont). (17.2.6) 
R=0 
On voit que l'expression (17.2.6) n’est rien d'autre que le déve- 
loppement canonique de la fonction de corrélation K,(£, t’). Les 
fonctions de coordonnées de ce développement canonique sont alter- 
nativement les cosinus et les sinus des fréquences multiples de w:; : 


cos ont, sinœné (k—0,1,... ). 


Nous avons déjà vu qu'il était possible de trouver à partir du 
développement canonique d’une fonction de corrélation le développe- 
ment de la fonction aléatoire correspondante avec les mêmes fonctions 
de coordonnées et des variances égales aux coefficients D, dans le 
développement canonique de la fonction de corrélation *). 

Par conséquent, le développement canonique de la fonction aléa- 


toire X (t) s'écrit : 
X (= > (Ur cost + Va sinœit), (17.2.7) 
=0 


*) On peut montrer que pour une fonction de corrélation quelconque k, (t) 
les coefficients D, donnés par les formules (17.2.4) ne sont pas négatifs. 
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où U», V, sont des variables aléatoires non corrélées d’espérances 
mathématiques nulles et d’égales variances pour tout couple de va- 
riables de même indice x: 


DIU) = DIV, = D,. (17.2.8) 


Les variances pour différentes valeurs de 4 sont données par les for- 
mules (17.2.4). 
Nous avons ainsi obtenu sur l'intervalle (0, T) le développement 


canonique de la fonction aléatoire Ÿ (1) dont les fonctions de coordon- 
nées sont cos œ4f, sin w,t pour différents w,. Ce développement est 


Dr 


x 
0 Qy Oz y Or 
Fig. 17.2.3 


appelé développement spectral d'une fonction aléatoire stationnaire. 
Il est à la base de la théorie spectrale des processus aléatoires station- 
naires. 

Le développement spectral représente une fonction aléatoire 
stationnaire comme décomposée suivant les oscillations harmoniques 
de différentes fréquences 


Ds Do, ee 7 DR ee 
d'amplitudes aléatoires. 


Calculons la variance de la fonction aléatoire X ({) donnée par le 
développement spectral (17.2.7). En vertu du théorème sur la varian- 
ce d'une fonction linéaire de variables aléatoires non corrélées on a : 


D, =D [X (£)] = 2 (cos? ot + sin° @at) D, 2 D,. (17.29) 


Ainsi, la variance d'une fonction aléatoire stationnaire est égale à la 
somme des variances de tous les harmoniques de son développerent spec- 


tral. La formule (17.2.9) montre que la variance de la fonction X (1) 
possède une certaine répartition suivant différentes fréquences : 
à certaines fréquences correspondent des variances plus importantes, 
à d’autres moins importantes. Graphiquement, on peut représenter 
cette répartition comme le spectre d’une fonction aléatoire station- 
naire (plus exactement, comme le spectre des variances). À cet effet 
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on porte sur l’axe des abscisses les fréquences wo — 0, wi, &2, . .. 
.... OR, - - . et suivant l’axe des ordonnées les variances corres- 
pondantes (fig. 17.2.3). 

Il est évident que la somme de toutes les ordonnees du spectre est 
égale à la variance de la fonction aléatoire. 


17.3. Développement spectral d’une fonction 
aléatoire stationnaire sur un intervalle 
de temps infini. Densité spectrale d'une fonction 
aléatoire stationnaire 


Lorsqu'on procède à la décomposition spectrale d’une fonction 


aléatoire stationnaire X (£) sur un intervalle de temps fini (0, T), 
on obtient le spectre des variances de cette fonction sous la forme 
d'une série de lignes discrètes séparées par des intervalles de temps 
égaux (spectre discontinu ou de raies). 

Il est évident que plus grand est l'intervalle de temps étudié, plus 
complètes sont nos données sur la fonction aléatoire. Ainsi, dans le 
développement spectral il est naturel d'essayer de passer à la limite 
pour T —+ oo pour voir ce que devient dans ce cas le spectre de la 
fonction aléatoire. Pour 7 —+> oo, wo = SE —+ 0; ainsi, la distance 
séparant les fréquences w, du spectre diminuera indéfiniment. Le 
spectre discret tendra vers le spectre continu dans lequel à tout petit 
intervalle de fréquences Aw correspondra la variance élémentaire 
AD (w). 

Essayons de représenter graphiquement un spectre continu. 
A cet effet, il faut quelque peu modifier le graphique du spectre dis- 
cret pour 7 fini. Nous porterons sur l'axe des ordonnées non plus la 
variance D, (diminuant indéfiniment pour 7 —> œ), mais la densité 
moyenne de variance, c'est-à-dire la variance rapportée à l'unité de 
longueur de l'intervalle de fréquences correspondant. Désignons par 
A la distance entre les fréquences voisines : 


Prenant pour base le segment Aw construisons le rectangle d'aire 
D, (fig. 17.3.1). Nous obtenons ainsi un diagramme en escalier rap- 
pelant l'histogramme de la répartition statistique. 

La hauteur du rectangle sur l'intervalle Aw attenant au point 
wo, est égale à 


D 
S: (0) = ‘ (17.3.1) 
elle correspond à la densité moyenne de la variance sur cet intervalle. 


L'aire totale de tout le diagramme est de toute évidence égale à la 
variance de la fonction aléatoire. 
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Tendons vers l'infini l'intervalle T. On aura alors Aw —+ 0 et la 
courbe en escalier se rapprochera à la limite de la courbe continue 
S x (w) (fig. 17.3.2). Cette courbe représente la densité de la réparti- 
tion des probabilités de la variance suivant les fréquences du spectre 


CPR x 
Fig. 17.3.1 


continu, la fonction S, (w) portant le nom de densité spectrale de la 
variance ou plus brièvement densité spectrale de la fonction aléatoire 


stationnaire X (£). 


Sx(w) 


0 (A) do () 
Fig. 17.3.2 


Il est évident que, comme auparavant, la surface limitée par la 
courbe $S, (w) doit être égale à la variance D, de la fonction aléatoire 
X (2) : 


SES S, &) de. (17.3.2) 


La formule (17.3.2) n’est rien d'autre que le développement de la 
variance D, en une somme de composantes élémentaires S, (w) do 


27—2823 
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égales chacune à la variance correspondant à l'intervalle élémentaire 
de fréquences dw attenant au point & (fig. 17.3.2). 

Nous avons ainsi introduit une nouvelle caractéristique d'un 
processus aléatoire stationnaire, à savoir la densité spectrale, don- 
nant la composition spectrale du processus stationnaire. Mais cette 
caractéristique n'est pas indépendante, étant entièrement déterminée 
par la fonction de corrélation du processus étudié. De même que les 
ordonnées D, du spectre discret s'expriment à l’aide des formules 
(17.2.4) par la fonction de corrélation k, (rt), la densité spectrale 
S,(w) peut être exprimée par la fonction de corrélation. 

Nous allons trouver cette expression. A cet effet nous passons dans 
le développement canonique de la fonction de corrélation à la limite 
pour 7 —+ et voyons ce qu'il devient. Le développement (17.2.1) 
de la fonction de corrélation en série de Fourier sur l'intervalle fini 
(—T, T) s'écrit: 


k.(tT)= D Drcosu:t, (17.3.3) 
k=0 
la variance correspondant à la fréquence «w, étant égale à: 
T 
Di=+ | ke (x) cos wir dr. (17.3.4) 
Ô 


Avant de passer à la limite pour 7 —+ œ passons dans la formule 


(17.3.3) de la variance D}, à la densité moyenne de la variance &. 


Calculée pour une valeur finie de T cette densité dépend de 7, nous 
la désignerons: 


SP (or) = À (17.3.5) 


En divisant l'expression (17.3.4) par Aw = + , nous obtenons : 


T 
SN (@,) = = Î k,(T) cos ot dt. (17.3.6) 


En vertu de (17.3.5) on a: 
Dr = SP (w,) Ao. (47.3.7) 
Le report de l'expression (17.3.7) dans la formule (17.3.3) donne: 
k.(t)= À SD (0) cosw,tAw. (17.3.8) 

. K=0 
Voyous ce que devient l'expression (17.3.8) pour 7 —+ oo. Il 


est clair qu'alors Aw —+ 0 ; l’argument discret w, devient l'argument 
w à variation continue; la somme devient une intégrale en w; 
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la densité moyenne de la variance ST) (w,) tend vers la densité 
spectrale S, (w), l'expression (17.3.8) devient alors à la limite: 


k, (t)= | S,(w) cos ot do, (17.3.9) 


où S,(&) est la densité spectrale de la fonction aléatoire stationnaire. 

En passant à la limite pour 7 —+ œ dans la formule (17.3.6) 
on obtient l'expression de la densité spectrale en fonction de la fonc- 
tion de corrélation: 


HOEE | ka (T) cos wt dr. (17.3.10) 
0 


En mathématiques l'expression (17.3.9) porte le nom d'intégrale 
de Fourier. L'intégrale de Fourier est une généralisation du dévelop- 
pement en série de Fourier dans le cas des fonctions non périodiques 
sur un intervalle de temps infini; c'est la décomposition d'une 
fonction en une somme d'oscillations harmoniques élémentaires 
à spectre continu *). 

Tout cumme la série de Fourier exprime la fonction développée 
en fonction des coefficients de la série, ceux-ci s'exprimant à leur 
tour en fonction de la fonction développée, les grandeurs x, (t) et 
Sx(w) s'expriment l’une en fonction de l'autre. Les formules du 
type (17.3.9) et (17.3.10) reliant réciproquement deux fonctions sont 
appelées {ransformations de Fourier **). 

Ainsi, la fonction de corrélation et la densité spectrale sont liées 
par des transformations de Fourier. | 

Notons que si dans la formule générale (17.3.9) on pose t = 0, 
on obtient l'expression (17.3.2) de la décomposition harmonique de 
la variance. 

En pratique on utilise souvent au lieu de la densité spectrale 
Sx(w) la densité spectrale normée : 


5, (@) = 5e , (17.3.11) 


où D, est la variance de la fonction aléatoire. 
Il est facile de voir que la fonction de corrélation normée p. (t) et 
la densité spectrale normée s, (w) sont liées entre elles par les mêmes 


*) La formule (17.3.9) est un cas particulier de l'intégrale de Fourier 
généralisant le développement en série de Fourier d'une fonction paire suivant 
= ne cosinus. On peut écrire une expression analogue dans un cas 
plus général. 


| mis formules citées sont le cas particulier des transformations de Fou. 
rier, dites transformations cosinus. 


Ji 
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transformations de Fourier : 
| 
Sx (&) cos wT dw, | 


(17.3.12) 


Px (x) Fe 


Or) £ 


Sx (©) = Z [ Px (T) cos wt dr. | 
0 


En posant t = 0 dans la première égalité (17.3.12) et compte tenu 
de p, (0) = 1, on a: 


sx (&) do = 1, (17.3.13) 


ce qui traduit le fait que l'aire limitée par la courbe de la densité 
spectrale normée est égale à l'unité. 

Exemple 1. La fonction de corrélation normée p, (t) de la fonction 
aléatoire X (t) décroit linéairement de l'unité à zéro pour 0 < + < %; pour 
T> To On a p, (t) = O (fig. 17.3.3). Trouver la densité spectrale normée de 
la fonction aléatoire X (+). 


Pr (t) 
I 


EE À : | 


Fig. 17.3.3 


Solution. La fonction de corrélation normée est donnée par les formu- 
les: 
T 
=1i—— pour 0 <+t< 7, 
Px (T) Vo 
= 0 pour T > To- 
Les formules (17.3.12) donnent : 


œ To 
2 2 
Sx (w)= À NmEnT | (1-=) mr (1 — cos wto)- 
0 


Le graphique de la densité ns normée est donné sur la figure 17.3.4. 
Le premier maximum, absolu, de la densité spectrale correspond à w = 0; 


en levant l’indétermination en ce point on obtient 2. Puis au fur et à mesure 
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de l'augmentation de w la densité spectrale admet plusieurs maxima relatifs, 
décroissant avec l'augmentation de w; pour © —+ oo on a s, (©) —+ 0. 

Le caractère des variations de la densité spectrale s, (w) (décroissance 
rapide ou lente) dépend du paramètre 1%. L aire totale limitée par la courbe 

(w) est constante et égale à l'unité. La varia- 

tion de to équivaut à un changement de l'échelle Sz(w) 
de la courbe suivant les deux axes en conser- 
vant son aire. Lorsque 7, augmente, l'échelle 
s'étend en ordonnées et diminue en abscisses : 
la nt de la fréquence 0 dans le spectre 
de la fonction aléatoire devient plus nette. A la 
limite pour To —+> æ la fonction aléatoire devient 
une variable aléatoire ordinaire; on a alors 
Px (T) == 1 et le spectre devient discret avec 
une seule et unique raie de fréquence wo = 0. 

Exemple 2. La densité spectrale nor- 
mée s, (&) de la fonction aléatoire X (t) est 
constante sur un certain intervalle de fréquences : 
@1, «2 et nulle à l'extérieur de cet intervalle Fig. 17.3.5 
(fig. 17.3.5). 

Trouver la fonction de corrélation normée de la fonction aléatoire X (+). 

Solution. La valeur de s, (w) pour &; << © << & s'obtient à partir 
de la condition que l’aire limitée par la courbe s, (w) est égale à l'unité: 


&, EL 


sx (0) (Oa—@y)== 1, 53 (0) 


Da — Q1 ° 
En vertu de (17.3.12) on a: 


os 
1 
P +<(t)= | Sx (©) cos OT dw = 0. Î cos WT do — 
CT w1 
_ : "ai {à : O2 + @: .. [ Wr— O1 
ua) te De an ( 5 r) sin (4 :) : 


L'allure générale de la fonction p, (t) est montrée sur la figure 17.3.6. 
Ce sont des oscillations d'amplitude décroissante avec des nœuds là ou la fonction 
s’annule. Dans chaque cas particulier la courbe dépend des valeurs à: «1, >. 


Fig. 17.3.6 


Il est intéressant d'étudier le cas limite quand w, —+ w2. 11 est évident 
que pour &: — &, — & le spectre de la fonction aléatoire devient une scule 
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et unique raie apparaissant à la fréquence w; la fonction de corrélation est 
alors une simple cosinusoide: 


Px (T) = cos wrt. 
Proposons-nous de déterminer l'allure de la fonction X (t) dans ce cas. Le déve- 
loppement spectral de la fonction aléatoire stationnaire X (t) dans le cas d'un 
spectre discret à raie unique sera: 
X (4) = U cos wt + V sin wt, (17.3.14) 


où U et V sont des fonctions aléatoires non corrélées d’espérances mathématiques 
nulles et de variances 
D{U] = D[V] = D. 


Montrons qu'une fonction aléatoire du type (17.3.14) peut être re résentée 
par une osSCillation harmonique de fréquence d'amplitude et de phase aléatoires. 
n introduisant les désignations: 


Ve y 
Vo Voir: 
l'expression (17.3.14) s'écrit : 
X (4) = VU2+ V2 (cos O cos wt+- sin ® sin wt) = VU2-+ V2 cos (wt — D). 


Dans cette expression VU?+ V3 est l'amplitude aléatoire et © la phase aléa- 
toire de l’oscillation harmonique. 


cos D — 


Jusqu’à présent nous n'avons envisagé que le cas continu de ré- 
partition des variances lorsqu'à un intervalle de fréquences infini- 
ment petit correspond une variance infiniment petite. Dans la pra- 
tique on rencontre des cas où la fonction aléatoire contient une com- 
posante purement périodique de fréquence w, et d'amplitude aléa- 
toire. Alors le développement de la fonction aléatoire contient en 
plus du spectre continu de fréquences, une raie isolée à la fréquence 
w, de variance finie D,. Dans le cas général le nombre de composan- 
tes périodiques peut être quelconque. Il est clair que le spectre de 
la fonction de corrélation se décomposera alors en deux parties: 
discrète et continue : 


kx (T) = D D} cos T7 + | S ,(w) cos wt do. (17.3.15) 
k Ô 


Des cas de fonctions aléatoires stationnaires à spectre mixte sont 
relativement rares. Il y a toujours lieu de séparer les composantes à 
spectre continu de celles à spectre discret, et de les étudier séparé- 
ment. 

Assez souvent on rencontre le cas particulier où la variance finie 
dans le développement spectral de la fonction aléatoire correspond à 
la fréquence nulle (w — 0). Ceci traduit le fait que la fonction aléa- 
toire contient comme composante une variable aléatoire ordinaire 
de variance D,. Dans ce cas il y a lieu d'étudier séparément cette 
composante. 
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17.4. Développement spectral d’une fonction 
aléatoire sous forme complexe 


Souvent les opérations sur les fonctions aléatoires se simplifient 
beaucoup si l’on écrit leur développement spectral, la densité spec- 
trale et la fonction de corrélation non pas sous la forme réelle, mais 
complexe. En particulier, les opérations linéaires les plus diverses 
sur les fonctions ayant la forme d'oscillations harmoniques (dériva- 
tion, intégration, résolution des équations différentielles linéaires, 
etc.), sont bien plus simples lorsque ces oscillations sont écrites non 
pas à l’aide des sinus et des cosinus, mais comme la somme d’expo- 
nentielles complexes. L'emploi de la forme complexe de représenta- 
tion de la fonction de corrélation et de la densité spectrale est justifié 
même si la fonction aléatoire (donc également sa fonction de corré- 
lation et sa densité spectrale) est réelle. 

Montrons comment on peut passer, formellement, de l'écriture 
réelle à la forme complexe de représentation du développement spec- 
tral d'une fonction aléatoire. 

Soit le développement spectral (17.2.8) de la fonction aléatoire 


X (t) sur l'intervalle (0, 7): 
X (t) = Ù (Un cos œnt + VA sin wut), (17.4.1) 
=0 


où U,, V, sont des variables aléatoires non corrélées, d'égales varian- 
ces pour chaque couple U,, V, de même indice valant : 


D [U,] = D [V,] — D,. 


Comme w, = Xi et wo = 0 l'expression (17.4.1) s'écrit : 
X (=Uo+ D (Us cos ont + V4 sin nt). (17.4.2) 
R=1 


Ecrivons maintenant le développement spectral (17.4.2) sous 
forme complexe. A cet effet il y a lieu d'utiliser les formules bien con- 
nues d'Euler : 


e 
COS ont = 2 : 


1 QE 
SIN Ogi — 7; = 5 . 


En substituant ces expressions dans la formule (17.4.2) on a: 
: ai iw, { —io,t io, t —io,,f 
X ()=Uo+ D QU RE — iv, > —) , (17.4.3) 


h=i 
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qui est le développement avec les fonctions de coordonnées ent, 
ent 
Transformons le développement (17.4.3) de telle sorte que les 


fonctions de coordonnées soient uniquement e**'; à cet effet nous 
convenons d'étendre le domaine des fréquences w, aux valeurs néga- 
tives de w et considérons donc les fréquences 


Op —= ko: (k = +1, +2, RS s): 


supposant que * prend non seulement des valeurs positives mais éga- 
lement négatives. La formule (17.4.3) s’écrira alors: 


À (= Uo+ D, PR eient D RH gioxt (17.4.4) 
k= 1 Rh=— 1 
en supposant que: 
UÙU x = Ur; Vox = Vr. 


La formule (17.4.4) donne le développement de la fonction aléa- 


toire X (#), dans lequel les fonctions de coordonnées sont les fonctions 
complexes ex! et les coefficients sont des variables aléatoires com- 
plexes. En désignant par W, (k — +1, +2, ...) ces variables 
aléatoires complexes, le développement (17.4.4) s'écrit : 


X (= Z West CRE) 
où 
W,=Uo pour k=—0; 
w Un—iVr | 
= "+ pour k>=>0; (17.4.6) 
W, = EUR pour k < 0. 


Nous allons maintenant montrer que l'expression (17.4.5) est 


bien le développement canonique de la fonction aléatoire X ({). A cet 
effet il suffit de montrer que les coefficients aléatoires de ce dévelop- 
pement ne sont pas intercorrélés. 

Soient tout d’abord les coefficients W, et W, de deux termes 
différents dans la partie positive du spectre pour 4 1, k > 0, 
1 => 0; nous allons calculer le moment de corrélation de ces grandeurs. 
Par définition pour des variables aléatoires complexes on a: 


K hr = M (W,W:], 


où W, est le complexe conjugué de W1. 
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Pour k>0,1=>0ona 


Ka M [Late DM fais UitiMi] 


= {M (UaU1) + M [Ua Val —iM [Ua + M [VaVi]} =0, 
car les variables aléatoires U,, V, figurant dans le développement 
(17.4.1) ne sont pas corrélées entre elles. 

On montre d’une manière analogue que les variables aléatoires 
W,, W. ne sont pas corrélées quels que soient les signes des indices Æ 
et ls k  +l. 

Il ne reste plus qu'à démontrer l’absence de corrélation entre les 
coefficients des termes symétriques du développement, c'est-à-dire 
les grandeurs W, et W_, pour k quelconque. On a: 


Ur—iVr U iVr 7 
KR, -R =MIWW=M IE | = 


= MI(Un—iVa)] = LM IUR —M [V3] —2iM [Ua Val}. 


Comme les grandeurs U,, V, figurant dans un même terme du deve- 
loppement (17.4.1) ne sont pas corrélées et ont les variances égales 
D, on obtient: 


Kh.-n = + {Dr — Da — 2i 0} = 0. 


Nous avons ainsi montré que l'expression (17.4.5) est bien le déve- 


loppement canonique de la fonction X (£) avec les fonctions de coor- 


données complexes ex" et les coefficients complexes W,. 
Calculons les variances de ces coefficients. Pour À = 0 la varian- 
ce D, reste telle qu’elle était dans le développement spectral réel. 
La variance de chacune des variables complexes W, (pour 4 = 0) 
est égale à la somme des variances de ses parties réelle et imaginaire : 
_ D{IUr] , DEVa) __2DIUR) De 
PO 2: 
Désignons 
D? = pour kÆ0; D? =D) pour k=0 


et construisons le spectre discret de la fonction aléatoire X (t) étendu 
aux fréquences de —c à “+ oo (fiz. 17.4.1). 

Ce spectre est symétrique par rapport à l’axe des ordonnées; à 
la différence du spectre de la figure 17.2.3, il est déterminé non seu- 
lement pour les valeurs positives des fréquences mais également pour 
les valeurs négatives, mais les ordonnées pour k O0 sont deux 
fois moindres que dans l'exemple précédent ; la somme de toutes les 
ordonnées reste, comme auparavant, égale à la variance de la fonc- 
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tion aléatoire X (#) : 
D,= ÿ Di. (17.4.7) 
Rka= — 00 


Déterminons la fonction de corrélation de la fonction aléatoire 


X (t) écrite sous la forme d’un développement spectral complexe 
(17.4.5). En appliquant la formule (16.2.15) donnant la fonction de 


Dk 


D 


Or Os -W; 0 Ur Ws Ws Wx 
Fig. 17.4.1 


corrélation d’une fonction aléatoire complexe écrite sous la forme 
d'un développement canonique on obtient : 


k, (£, 1”) = À Di eva l'olont — 2 D: eivnt'e—iont =, S D? ext" 0 


= 
ou en passant à l'argument t = {” — t: 


k.()—= D Diet, (17.4.8) 
Rs — 00 
avec 
T 
Di = Di=y | He()cosuxtdt pour #0.  (17.4.9) 
U 
Ecrivons également (17.4.9) sous forme complexe. Posant : 


10,T he 
2 9 


COS GOT = 
on obtient : 
T 


D = ke (7) (e!a* + ex") dr — 


= _. { k, (x) ea" dr + | ka (x) ex" a} à 
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Posant dans la seconde intégrale t = —u on a: 
T —T 0 
k (x) eltx" dr = — | ke (u) e7 1x" du = | k, (x) 7x" ar, 
Û -T 
d'où 
T 
Di = LEZ (te xt ar. (17.4.10) 
-T 


Nous avons ainsi obtenu la forme complexe du développement 
spectral d’une fonction aléatoire sur l'intervalle fini (0, T). Il est 
naturel ensuite de passer à la limite pour T —+ œ comme nous l'avons 
fait pour la forme réelle. En introduisant la densité spectrale : 

S 


DÀ 
SX (w@) = Jim à ur 
nous obtenons, à la limite, à partir des formules (17.4.8), (17.4.10), 
les formules intégrales reliant la fonction de corrélation et la densite 


spectrale complexe. A la limite pour 7 —+ œ les formules (17.4.8) 
et (17.4.10) donnent: 


k, (T) = | S2 (w) es do, (17.4.11) 


S2 (uw) = | ka (t)e—ior dr. (17.4.12) 


Les formules (17.4.11) et (17.4.12) sont la forme complexe des 
transformations de Fourier, reliant la fonction de corrélation et la 
densité spectrale *). 

On peut obtenir les formules (17.4.11) et (17.4.12) directement 
à partir des formules (17.3.9) et (17.3.10) en introduisant la substi- 
tution : 
elot Lo ior 

2 


en posant de plus S, (w) = 2S2% (w) et en étendant le domaine d'in- 
tégration sur l'intervalle [— 00 co, + ool. 
En posant + = 0 dans la formule (17.4.11) on obtient l’expres- 


sion de la variance de la fonction aléatoire X (#) : 


COS OT = 


D. = j S® (w) do. (17.4.13) 


+) Rapp Rap ppeion que dans le chapitre 13 nous avons déjà rencontré des trans- 
formations Fourier exprimant la fonction caractéristique et la densité de 
probabilité l’une en fonction de l’autre. 
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La formule (17.4.13) donne la variance d’une fonction aléatoire 
sous la forme d’une somme de variances élémentaires réparties avec 
une certaine densité sur toute la gamme de fréquences de — o à 
+ oc. 

En comparant la formule (17.4.13) avec la formule (17.3.2) pour 
la forme réelle du développement spectral, on voit qu'elles ne diffè- 
rent que par la densité spectrale S£ (w) qui dans la formule (17.4.13) 


Fig. 17.4.2 


est définie non pas de 0 à w, mais de — à + , en revanche ses 
ordonnées sont deux fois moindres. Les deux fonctions de la densité 
spectrale sont représentées sur un graphique (fig. 17.4.2). On voit 
qu'elles ne diffèrent que par l'échelle suivant l'axe des ordonnées, 
et par le fait que la fonction S, (w) n'est pas définie pour les fré- 
quences négatives. En pratique on utilise tant l'une que l’autre ex- 
pression de la densité spectrale. 

Parfois on prend pour argument de la densité spectrale non pas la 
pulsation w mais la fréquence des oscillations exprimées en hertz : 


Dans ce cas en posant w — 21f la formule (17.4.11) devient 
ke (TD =2n | 52 (2n) ei dj, 
ou en introduisant la désignation: 


G; () = 218: (2xf), 


on a définitivement : 
k, (x) = | G,.(N) exit df. (17.4.14) 


La fonction G, (f) peut également être utilisée comme la densité 
spectrale de la variance. Elle s'exprime comme suit à l’aide de la 
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fonction de corrélation : 


G.() = [ ks (x) e-2xifr ar. (17.415) 


Les expressions que nous avons données pour la densité de pro- 
babilité, ainsi que certaines autres utilisées dans la pratique, ne diffè- 
rent que par l'échelle. Chacune d'elles peut être normée en divisant 
la densité spectrale correspondante par la variance de la fonction 
aléatoire. 

Exemple 1. La fonction de corrélation de la fonction aléatoire X (t) 
est donnée par la formule: 

k, (t)=De 44, (17.4.16) 
où a >0 (Mig. 17.4.3). 

En utilisant la transformation de Fourier sous forme complexe trouver 

la densité spectrale S2 (w). 


Ka) 


D 


0 
Fig. 17.4.3 Fig. 17.4.4 


Solution. La formule (17.4.12) donne: 


S° (&)=5— fe lTig—iot a { ee iut dt+ feet ar} _ 


= { | e(a-ie) ct | e(a-+ie)t a} = 
0 


eee rte. 
= | 1 1 ] Da 
2x La—io ‘'a+iw | rx (a? +2) 

La densité spectrale: 


Da 
S(@)= G+03 


est représentée sur la figure 17.4.4. 
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Nous allons étudier la fonction de corrélation et la densité spectrale pour 
différentes valeurs de a. 

Pour des & PAR la fonction de corrélation décroît plus lentement et l'allure 
de la fonction aléatoire devient plus douce; les fréquences basses dominent dans 
le spectre de la fonction aléatoire; la courbe de la densité spectrale s’allonge 
vers le haut, se rétrécissant simultanément des côtés; à la limite pour & —+ 0 
la fonction aléatoire dégénère en une variable aléatoire à spectre discret se 
composant d’une seule raie à la pulsation wo = 0. 


Au fur et à mesure de l'augmentation de « la fonction de corrélation 
décroît rapidement, les oscillations de la fonction aléatoire deviennent brusques 


1\Pz (T) 


Fig. 17.4.5 


et désordonnées ; dans le spectre de la fonction aléatoire l'influence des fréquen- 
ces basses se fait de moins en moins sentir; pour & —+ oc le spectre de la fonction 


aléatoire tend à être uniforme (celui du «bruit blanc») sans fréquences prédomi- 
nantes. 


Exemple 2. Soit la fonction de corrélation normée de la fonction 
aléatoire X (+) (fig. 17.4.5): 
Px (t)=e"%1Tl cos Br 
Trouver la densité spectrale normée. 
Solution. Ecrivons p, (t) sous forme complexe: 
pe (mme ail Het 


La densité spectrale normée s% (w) est donnée par la formule (17.4.12); en 
y substituant p,Tt au lieu de k, (t) on a: 


ir, e7iBt 
2 


œ 
se = | e—aitie eo gr — 


0 co ‘ 
_ _. { | EU (eiBT + 0e iBT) e— 10 gp | AT (eiBt+e-iBt) ç—iuT ar} 
co 0 
d’où après des transformations élémentaires: 


Se D RE 
sx (0=sT { au BE *a2-+(u— #2 } : 
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L'allure de la courbe de la densité spectrale dépend du rapport des para- 
mètres « et B et est différente suivant que prédomine dans la fonction de corré- 


lation l'amortissement de loi e-%%! ou l'oscillation de loi cos Bt. Il est clair 
que quand « << f le processus est manifestement oscillatoire, pour des « > B 
c'est l'amortissement qui prédomine. 

Dans le premier cas la fonction aléatoire est presque périodique de pulsa- : 


tion B, d'amplitude et de phase aléatoires; dans le spectre de la fonction aléatoire 


pere en les pulsations voisines de f. Dans le second cas la composition spectra- 
c de la fonction aléatoire est plus uniforme sans influence prononcée de fré- 
quences particulieres ; à la limite pour & —+ le spectre de la fonction aléatoire 
tend vers celui du bruit blanc. 

A titre d'illustration sur la figure 17.4.6 on a représenté les densités de 
prohabilité normées pour les cas suivants: 1) B — 2, « — 1 (courbe 7): 2) B = 2, 
a = 3 (courbe 77). La figure montre que pour « = 1 le spectre de la fonction 
aléatoire accuse des maxima au voisinage des pulsations w = + f. Pour a = 3 
(courbe 77) la densité spectrale dans une large gamme de fréquences reste presque 
constante. 


17.5. Transformation d'une fonction aléatoire 
stationnaire par un système linéaire stationnaire 


Dans le chapitre 16 nous avons étudie les règles générales des trans- 
formations linéaires des fonctions aléatoires données sous forme de 
développements canoniques. En vertu de ces règles, lors des transfor- 
mations linéaires des fonctions aléatoires, leurs espérances mathé- 
matiques et leurs fonctions de coordonnées sont soumises aux mêmes 
transformations Nnéaires. Ainsi, soumettre à une transformation li- 
néaire une fonction aléatoire équivaut à appliquer cette même trans- 
formation linéaire à plusieurs fonctions non alcatoires. 

Dans le cas des transformations linéaires des fonctions aléatoi- 
res stationnaires, le problème se simplifie davantage. Si l’action 


d'entrée X (£) et la réponse du système Y (£) sont stationnaires, la 
transformation d’une fonction aléatoire peut se réduire à la trans- 
formation d'une seule fonction non aléatoire, à savoir de la densité 
spectrale S, (w). 
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Pour que la réponse à une action stationnaire le soit également, 
il faut évidemment que les paramètres du système (par exemple, les 
résistances, les capacités, les inductances des circuits, etc.) soient 
constants et non variables. Nous appellerons système linéaire station- 
naire un système linéaire à paramètres constants. Généralement, le 
fonctionnement d'un système linéaire stationnaire est décrit par des 
équations différentielles linéaires à coefficients constants. 


CT a 


Fig. 17.5.1 


Nous allons maintenant étudier la transformation d'une fonction 
aléatoire stationnaire par un système linéaire stationnaire. Suppo- 
sons qu'une fonction aléatoire stationnaire X ({) d'espérance mathé- 
matique m, et de fonction de corrélation k, (tx) soit appliquée à un 
système linéaire L. La fonction aléatoire Ÿ (£) est la réponse du sys- 
tème (fig. 17.5.1) dont il y a lieu de déterminer les caractéristiques. 

Comme pour la solution du problème posé il nous faudra trans- 
former des fonctions non aléatoires, à savoir l'espérance mathéma- 
tique et les fonctions de coordonnées, nous déterminons tout d'abord 
la réponse du système L à une action non aléatoire x (f). 

Ecrivons sous forme opérationnelle l’équation différentielle à 
coefficients constants reliant la réponse y (ft) du système à l'action 
Z (£): 

(an P° + an-1p" “+... + @p + @o) y (€) = 
= (bnp -+ bmp +... + bip + bo) x (t), (17.5.1) 
où p — _ est l'opérateur de dérivation. 


En employant l'écriture condensée de (17.5.1): 
À, (p) y (1) = B, (p) zx (t), (17.5.2) 


et en résolvant formellement l'équation (17.5,2) par rapport à y (t) 
on peut exprimer sous forme explicite l'opérateur du système: 


_… By (p) 
y (t) Au À (4). (17.5.3) 

La solution de l’équation différentielle linéaire (17.5.1) fournit 
la réponse du système L à l’action zx (f). Il est connu de la théorie 
des équations différentielles que cette solution se compose de deux 
termes yr (£) et yrs (1). Le terme y} (t) est la solution de l'équation 
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sans second membre et donne les oscillations propres ou libres du 
système. Ce sont les oscillations du système en l’absence d'action à 
l'entrée, si à l'instant initial le système s’est trouvé hors de l'état 
d'équilibre. Dans la pratique le plus souvent on a affaire à des systè- 
mes stables ; les oscillations propres de ces systèmes s’amortissent 
dans le temps. 

Si l’on considère les intervalles de temps suffisamment éloignés 
de l'origine du processus, lorsque tous les processus transitoires sont 
terminés et le système travaille en régime stable, on peut omettre le 
second terme yr, ({) en se limitant au premier terme y, (t). Ce pre- 
mier terme traduit les oscillations forcées du système dues à l’action 
donnée x ({). 

Dans le cas où l’action z (£) est une fonction analytique assez 
simple, on arrive souvent à trouver la réponse sous une forme analy- 
tique également simple. En particulier, lorsque l’action est une oscil- 
lation harmonique de fréquence donnée, Ja sortie scra également une 
oscillation harmonique de même fréquence, mais d'amplitude et de 
phase différentes. 

Comme les fonctions de coordonnées du développement spectral 
d'une fonction aléatoire stationnaire X ({) sont des oscillations har- 
moniques, il nous faut tout d’abord savoir déterminer la réponse du 
système à une oscillation harmonique de fréquence donnée w. La solu- 
tion de ce problème est particulièrement simple si l’oscillation harmc- 
nique s'écrit sous forme complexe. 

Supposons qu'une oscillation de la forme: 


x (t) = civt (17.5.4) 


agisse à l'entrée du système. 
Cherchons la réponse du système y ({) également sous la forme 


d'une oscillation harmonique de fréquence w multipliée par un cer- 
tain facteur complexe © (io): 


y (4) =@ (ià) civt. (17.5.5) 


Calculons le facteur ® (iw). A cet effet nous allons substituer 
la fonction (17.5.4) dans le second membre et la fonction (17.5.5) 
dans le premier membre de l'équation (17.5.1), il vient: 


an pe [D (iu) et] + ans er (D (a) etot] + … 


+ a [D (iw) eiét] + a [D (éw) ef] = 


. om iwt + b “hi eiut + b, < eivt + b lu 17.9.6 
= bn got + bn Left +. db où + bueiut,  (17.5.5 


28—2823 
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Comme pour k quelconque on a 
M er ; iwt sn \À oi : 
am © = (iw) e'“!, EC [D (éw) et”!] -= (iw)* eiv'OD (iw), 
en divisant les deux membres de l'équation (17.5.6) par eiv!, on 
obtient 
O (iw) [ax (i@)" + an-1 (éw)" "+... + à (iw) + ao] == 
= bn (©) + ms (D) +... + bi (éw) + bo- (17.5.7) 


Le facteur de ® (iw) n’est donc rien d'autre que le polynôme 
An (P) = np" + 4n1p" 7" +... + &p + ao où l'opérateur p a 
été remplacé par (iw) ; d’une manière analogue, le second membre de 
l'égalité (17.5.7) est l'expression de B,, (iw). L'équation (17.5.7) 
s'écrit alors 

D (io) À, (io) = Bh (iw), 
d’où : 
: m (iw ” 
D (iw) = 2e nes (17-5.8) 


La fonction ® (iw) est appelée caractéristique fréquentielle ou 
réponse en fréquence d’un système linéaire. Pour trouver la caracté- 
ristique fréquentielle il suffit de remplacer l'opérateur de dérivation 
p par iw dans l'opérateur du système écrit sous la forme explicite 
(17.5.3). 

Ainsi, si l'entrée d'un système linéaire à paramètres constants est 
altaquée par une oscillation harmonique e'“t, la réponse du système 
est cette même oscillation harmonique multipliée par la caractéristique 
fréquentielle du système ® (iw). Soit l’action d'entrée 


z(t) = Ueist, (17.5.9) 


où U est une certaine grandeur ne dépendant pas de £. Le système 
étant linéaire, la grandeur U peut être mise en facteur devant le 


»« 


signe de l’opérateur, et la réponse du système à l’action (17.5.9) 


sera | 
y (t) = UO (iw) eïst. (17.5.10) 


IL est évident que cette propriété se conserve mème si la grandeur 
U est aléatoire (il suffit qu'elle ne dépende pas de !). 

Nous allons appliquer les méthodes exposées de transformation 
des oscillations harmoniques par un système linéaire à l’espérance 
mathématique de la fonction aléatoire X (£) et aux fonctions de coor- 
données de son développement spectral. 

Ecrivons l'espérance mathématique m, de la fonction aléatoire 
stationnaire X ({) comme une oscillation harmonique de pulsation 
w — 0 et posons w = 0 dans la formule (17.5.8) 


® (0) =, (17.5.11) 
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d’où l'espérance mathématique à la sortie du système est 
My = = My. (17.5.12) 


Passons maintenant à l'étude de la transformation linéaire de 
la partie essentiellement aléatoire 


X(})=X(D—m, (17.5.13) 
de la fonction X (ft). 


A cet effet écrivons le développement spéctral de la fonction X (4) 
sur l'intervalle (0, 7) 
X()= D Ueitst, (17.5.14) 
R=—— 00 


où U, sont des variables aléatoires non corrélées, dont les variances 
forment le spectre de la fonction aléatoire X (ét). 
Soit un terme de cette somme 


Xh (4) = Unel®af. (17.5.15) 
La réponse correspondante du système sera 
Ya (4) = 030 (iox) en". (17.5.16) 


En vertu du principe de superposition, la réponse du système 
à la somme des actions est égale à la somme des réponses à des ac- 
tions séparées. Par conséquent, la réponse du système à l’action 
(17.5.14) peut être écrite comme le développement spectral 


Ÿ (t) = > U,O (ioz) ex! 


ou, en introduisant la oo UD (ior) = W;, 


Y (= S Wen", (17.5.17) 


W, étant des fonctions PP non corrélées d’espérances mathé- 
matiques nulles. 

Nous allons maintenant trouver le spectre de ce développement. 
A cet effet calculors d’abord la variance de la variable aléatoire 
complexe W, dans le développement (17. à. 17). La variance d'une 
variable aléatoire complexe étant égale à l'espérance mathématique 
du carré de son module, on a 


DIW:]=MII0:0 (Go:)|1=MTIUx F1 (ox) |?] = 
=|O (iox) PM [1 U3 [1 =1 D (ax) 2 Ds. (17.5.18) 


Ce qui nous permet de conclure que lors de la transformation d'une 
jonction aléatoire stationnaire par un système stationnaire linéaire, 


28° 
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chacune des ordonnées du spectre se trouve multipliée par le carré du 
module de la réponse en fréquence du système pour la fréquence corres- 
pondante. 

Ainsi, lorsqu'une fonction aléatoire stationnaire traverse un 
système stationnaire linéaire son spectre se trouve modifié : certaines 
fréquences sont amplifiées, d’autres au contraire affaiblies (filtrées). 
Le carré du module de la réponse en fréquence montre comment le 
système réagit à une oscillation de telle ou telle fréquence. 

Tout comme précédemment nous allons passer dans la représen- 
tation spectrale d’une fonction aléatoire à la limite pour 7 —+ 
et du spectre discret à la densité spectrale. Il est évident que la den- 
sité spectrale à la sortie du système linéaire s'obtient à partir de la 
densité spectrale à l'entrée par multiplication par | ® (io) [*, tout 
comme étaient obtenues les ordonnées du spectre discret : 


S,(&) =|® (iw) PS, (w). (17.5.19) 


D'où la règle relativement simple suivante: 

Lors de la transformation par un système linéaire stationnaire d’une 
fonction aléatoire stationnaire sa densité spectrale se trouve multipliée 
par le carré du module de la réponse en fréquence du système. 

Cette règle permet de trouver facilement les caractéristiques d’une 
fonction aléatoire à la sortie d’un système linéaire, connaissant les 
caractéristiques d'entrée. 

Soit une fonction aléatoire stationnaire X (f) d'espérance mathc- 
matique m. et de fonction de corrélation X. (t) appliquée à l'entrée 
d'un système linéaire stationnaire dont l'opérateur est donné par 
(17.5.3). [1 y a lieu de trouver l'espérance mathématique m, et la 
fonction de corrélation k, (t) de la fonction aléatoire Y (£) à la sortie 
du système. 

Nous allons résoudre le problème dans l’ordre suivant : 

1. Déterminons l'espérance mathématique à la sortie: 


my= m. (17.5.20) 


2. Cherchons la densité spectrale à l’entrée d’après la fonction 
de corrélation À, (t) (formule (17.4.12)) : 


S2 (0) => | ka (Te-iordr®). (17.5.21) 


3. A l'aide de la formule (17.5.8) nous calculons la réponse en 
fréquence du système et le carré de son module: 


| B,, (iw) |? 
|® (iv) P = LS (17.5.22) 


*) Pour simplifier l'écriture nous omettons le signe * dans la notation 
de la densité spectrale. 
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4. En multipliant la densité spectrale à l’entrée par le carré du 
module de la réponse en fréquence nous trouvons la densité spectrale 
à la sortie: 

Sy(w)=|® (io) F S, (0). (17.5.23) 


5. Enfin, d’après la densité spectrale S,, (w) nous obtenons la 
fonction de corrélation k, (rt) à la sortie du système: 


k, (x) = [ S, (6) eiur do. (17.5.24) 


Le problème posé se trouve ainsi résolu. 
Souvent il y a lieu de connaître non pas la fonction de corrélation 
k, (xt) à la sortie du système, mais seulement la variance D, : 


Dy = ky (0). 


La formule (17.5.24) conduit pour + = 0 à une formule bien plus 
simple : 


D,= | S, (&) de, 
ou tenant compte du fait que la fonction S, (w) est paire, on a: 
D, =2 | S, () de. (17.5.25) 
0 


Exemple. Le fonctionnement d’un système dynamique linéaire est 
décrit par l'équation différentielle linéaire du premier ordre: 


(asp ++ ao) y (9 = (bip + bo) z (1), (17.5.26) 
ou 
y = 2 (0). 


L'entrée du système est attaquée par une fonction aléatoire stationnaire 
X (t) d'espérance mathématique m, et de fonction de corrélation 


ke (T) =D el, (17.5.27) 


où « est un coefficient positif (voir exemple 1 du 8 17.4). Trouver l'espérance 
mathématique m,, et la variance D,, à la sortie du système *). 


*) Choisissant pour la fonction de corrélation de la fonction aléatoire X (t) 
l'expression (17.5.27) fréquemment utilisée dans la pratique pour sa simplicité, 
nous nous rendons compte qu'en toute rigueur la fonction A lédtoire X (t) dont 
la fonction de corrélation est donnée par cette expression n'est pas dérivable, 
par conséquent elle ne peut satisfaire à des équations différentielles dans le 
scas général. On peut surmonter cet obstacle si l'on considère l’expression 
(17.95.27) comme l approximation de la fonction de corrélation. 
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Solution. La formule (17.5.20) donne: 


My = qe Mae 
I1 est évident que la grandeur m,, ne dépend pas du paramètre @, croît 


en raison directe de bo et décroît en raison inverse de ao. 
La densité spectrale à l’entrée est calculée comme dans l’exemple 1 du 


& 17.4 


A porta 2e 
Set=g | keine TE 
0 
(voir fig. 17.4.4). 
A l'aide de la formule (17.5.8) nous trouvons la réponse en fréquence du 
système : 
— brio + bo 
TT E 77 


et le carré de son. module: 
biiwbol?  bw2—+b3 
DUT ae — ajorpat * 


Puis nous déterminons la densité spectrale à la sortie du système: 
(2 
Sy(o)=1 (io) Sr (o)= = = ——— 7 


Ensuite à l’aide de la formule (17.5.25) nous calculons la variance à la 
sortie: 
oœ 
_2D; ( biw?+b3 a 
Due | ajurpe arpar d0 


- Pour calculer l'intégrale nous allons écrire l’expression sous l'intégrale 
à l’aide de fractions simples: 
b?w2 + bà %œ À + B 
ato2+ai a+w2 ai+alu2 a+? 
et trouver les coefficients: 
afbg — agbi 


aia?— ai ” 
_, et 
BST 


Il vient finalement : 
D, =D a1b5 + aobia 
V7 * agai (aa + db) 
En conclusion de ce paragraphe nous mentionnons comment se 


transforme par un système linéaire une fonction aléatoire stationnaire 
contenant une variable aléatoire ordinaire additive: 


X1(9 = Uo+ X (b, (17.5.28) 


Uo étant une variable aléatoire de variance D, et X (f) une fonction 
aléatoire stationnaire. 
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La réponse du système à l'action X; (f) est la somme des réponses 
aux deux termes de (17.5.28). Nous avons déjà calculé la réponse à 
l’action X (t). Considérant l’action U, comme une oscillation harmo- 
nique de pulsation w = 0, il vient en vertu de la formule (17.5.11) : 


Vo Un. (17.5.29) 


Le terme V, s’ajoutera simplement à la réponse du système à 
action ZX (t). 


17.6. Applications de la théorie des processus 
aléatoires stationnaires aux problèmes d'analyse 
et de synthèse des systèmes dynamiques 


Dans le paragraphe précédent nous avons envisagé la transfor- 
mation d'une fonction aléatoire stationnaire par un système linéaire 
et obtenu des méthodes simples permettant de résoudre ce problème. 
Rappelons que la transformation d'une fonction aléatoire s’est trou- 
vée réduite à une transformation simple (multiplication par le carré 
du module de la réponse en fréquence) d’une seule fonction, à savoir 
de la densité spectrale. Cette simplicité extraordinaire de la théorie 
spectrale des processus aléatoires stationnaires en fait un appareil 
de choix pour l'étude des systèmes dynamiques linéaires soumis à 
l'action de perturbations aléatoires (bruits). 

Généralement dans bon nombre de problèmes se rencontrant dans 
la pratique on n’a pas besoin de connaître la fonction de corrélation 
k, (t) à la sortie du système mais seulement la variance correspon- 
dante 


D, = k, (0) 


caractérisant les erreurs du système dues aux perturbations aléa- 
toires l’attaquant et pouvant dans beaucoup de cas servir de critère 
de la qualité du fonctionnement du système. 

L'étude des systèmes dynamiques par les méthodes de la théorie 
des fonctions aléatoires a pour but de résoudre deux types de proble- 
mes que l’on peut appeler « directs » et « inverses ». 

Le problème direct consiste à étudier le fonctionnement d’un 
système dynamique linéaire, dont on connaît les paramètres et dont 
le fonctionnement est décrit par l’équation différentielle linéaire : 


(anp"+an4p" +... +aip+a@o)y(t) = 
= (bnp + bnp 1+ ... + bip + bo) x (t), (17.6.1) 


en présence d'une action aléatoire stationnaire appelée généralement 
« bruit stationnaire ». A cet effet on étudie tout d’abord le bruit aléa- 
toire, on détermine sa fonction de corrélation et sa composition spec- 
trale. Puis par les méthodes décrites ci-dessus on trouve le spectre 
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et la variance de la fonction aléatoire à la sortie du système, cette 
dernière dépendant évidemment tant des caractéristiques de l’action 
aléatoire d'entrée que des coefficients de l’équation. Ce problème 
une fois résolu, on peut estimer la précision du fonctionnement du 
système donné en présence de bruits. 

Dans le problème inverse il y a lieu de choisir les coefficients de 
l'équation (17.6.1) de telle sorte que, pour une composition spectrale 
du bruit donnée, les bruits à la sortie soient minimaux. Pour des 
caractéristiques données de la fonction aléatoire (bruit) à l'entrée 
du système, la variance à la sortie dépend de tout l’ensemble des coef- 
ficients de l'équation: 


D, =D, (ah, Œn-ts > +.) Sir do) Dm; bm-1; dés b;, bo). 


Les coefficients de cette équation dépendent des paramètres cons- 
tructifs du système dont certains peuvent varier dans les limites 
assez larges. On peut choisir les valeurs de ces paramètres de façon 
à rendre minimale la variance D. 

Il faut noter que dans la plupart des cas on n'arrive pas à satis- 
faire à cette condition. En effet les expressions que nous avons trou- 
vées pour la fonction de corrélation et la variance à la sortie du 
système ne sont vraies que pour des instants { suffisamment éloignés 
de l’origine du processus aléatoire, lorsque tous les processus transi- 
toires dans le système liés à ses oscillations libres ont eu le temps de 
s’amortir. Dans la pratique, souvent, on se trouve obligé d'utiliser 
les systèmes dynamiques linéaires (viseurs, calculateurs, systèmes 
asservis, etc.) durant un laps de temps limité ; la vitesse d'amortis- 
sement des processus transitoires dans le système dépend de ses para- 
mètres constructifs, c’est-à-dire des coefficients de l'équation (17.6.1). 
Si l’on choisit ces coefficients de telle sorte que soit minimale la 
variance à la sortie (pour des instants suffisamment éloignées) ceci 
entraîne l'apparition à la sortie du système d’autres erreurs dues 
à ce que les processus transitoires dans le système n'ont pas encore 
pris fin. Ces erreurs sont appelées erreurs dynamiques. 

La durée limitée de fonctionnement des systèmes linéaires et la 
nécessité de tenir compte des erreurs dynamiques dictent 
une solution de compromis telle que, d'une part, la variance 
à la sortie du système soit suffisamment petite et d'autre part, les 
erreurs dynamiques ne soient pas trop importantes. 

Lorsque les paramètres optimaux sont choisis compte tenu tant 
de la variance que des erreurs systématiques dynamiques, on prend 
souvent pour critère de précision du fonctionnement du système, 
le second moment initial æ&> à la sortie du système: 


a = D,+ mi (17.6.2) 


que l’on s'efforce de rendre minimal. Ici D, est la variance et m, 
l'erreur systématique à la sortie du système. 
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Parfois dans le choix du critère d'estimation du fonctionnement 
du système on est guidé de son utilisation éventuelle. 

Mentionnons encore un problème que pose la construction ration- 
nelle des systèmes dynamiques. Jusqu'à présent nous n'avons parlé 
que du choix judicieux des coefficients de l’équation (17.6.1), la 
forme de l'équation étant supposée donnée. Dans la synthèse des syste- 
mes dynamiques le problème se pose d’une manière plus générale. 
En particulier, il s’agit de définir la forme même de l'équation ou 
plus généralement, l'opérateur optimal du système dynamique. Ces 
problèmes peuvent être résolus à l’aide de la théorie des fonctions 
aléatoires. 

Souvent dans les problèmes pratiques d'analyse et de synthèse 
des systèmes dynamiques on n'arrive pas à limiter le champ d’études 
à des processus aléatoires stationnaires et donc à se servir de l’appa- 
reil correspondant de la théorie spectrale. Pourtant dans certains cas 
il suffit simplement de modifier quelque peu cet appareil pour pou- 
voir également l’appliquer aux processus non stationnaires. On ren- 
contre fréquemment des fonctions aléatoires et des systèmes dynami- 
ques dits « quasi stationnaires » et dont les caractéristiques et para- 
mètres varient dans le temps relativement lentement. Pour l'étude 
de ces processus aléatoires V. Pougatchev a proposé une méthode 
différant peu de la méthode spectrale mais pouvant être appliquée 
dans une gamme plus étendue de conditions *). 


17.7. Ergodicité des fonctions aléatoires 
stationnaires 


Soit une certaine fonction aléatoire stationnaire X (£), supposons 
qu'il ait lieu d'estimer son espérance mathématique m. et sa fonction 
de corrélation k, (t). Ci-dessus (voir $ 15.4) nous avons exposé les 
méthodes permettant d'obtenir ces caractéristiques par dépouille- 
ment des données expérimentales que sont les réalisations de la fonc- 
tion aléatoire X (4). Le traitement de ces réalisations permet de trou- 
ver les estimations de l'espérance mathématique m, (x) et de la fonc- 
tion de corrélation K,(£, t’). Vu le nombre limité d'observations, 


la fonction m. (f) ne sera pas rigoureusement constante ; il y aura 
lieu d'en prendre la moyenne qui est une certaine grandeur constante 


m, et de la remplacer par cette moyenne; d’une manière analogue, 
en prenant la moyenne des X, (4, t{”) pour différentes valeurs de 


t =’ — t on obtient la fonction de corrélation &, (t). 
Cette méthode de traitement est évidemment assez compliquée 
et de plus doit être réalisée en deux étapes; tout d'abord on trouve 


*) Voir V. Pougatchev. Théorie des fonctions aléatoires et ses applications 
à la théorie de la commande automatique (en russe). Fizmathguiz, 1962. 
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les caractéristiques approchées de la fonction aléatoire puis on cal- 
cule la moyenne, également approchée, de ces caractéristiques. Il 
semble alors naturel d’essayer, pour une fonction aléatoire station- 
naire, de simplifier ce traitement complexe en supposant que l’espé- 


rance mathématique ne dépende pas du temps et la fonction de corré- 
lation de l’origine des temps. 


Fig. 17.7.1 


Ensuite, il est légitime de s'intéresser s'il est indispensable de 
disposer de plusieurs réalisations d’une fonction aléatoire station- 
naire. Le processus aléatoire étant stationnaire et homogène dans le 
temps, il est tout naturel de supposer qu'une seule réalisation assez 
longue suffit pour obtenir les caractéristiques de la fonction aléatoire. 


Xz(t) 


MER 
RCA 
NV AVIS" 


Fig. 17.7.2 


Une étude plus détaillée de la question montre que ceci n’est pas 
vrai pour tous lé processus aléatoires; une seule réalisation assez 
longue n’est pas toujours équivalente à un ensemble de réa- 
lisations séparées. 

A titre d'exemple nous allons envisager deux fonctions aléatoires 
stationnaires X, (£) et X, (t) (figures 17.7.1 et 17.7.2) données chacune 
par un ensemble de réalisations. 

La fonction aléatoire X, ({) présente la particularité suivante: 
toutes ses réalisations ont même valeur moyenneet même ampli- 
tude moyenne des oscillations. Choisissons au hasard l’une de ces 
réalisations et imaginons que l'expérience nous a fourni cette réali- 
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sation sur un certain intervalle de temps T. Il est évident que si T 
est suffissamment grand cette. réalisation unique donne une informa- 
tion suffisante sur les propriétés de la fonction aléatoire en entier. 
En particulier, en prenant la moyenne de cette réalisation suivant 
l'axe des abscisses, donc sur le temps, on espère d'obtenir la moyenne 
de l’espérance mathématique de la fonction aléatoire; en prenant la 
moyenne des carrés des écarts de cette moyenne temporelle on obtient 
la valeur approchée de la variance, etc. 

On dit qu'une telle fonction aléatoire est douée de la propriété 
d’ergodicité ou d'ergodisme. En vertu de cette propriété chaque réa- 
lisation particulière *) de la fonction aléatoire est « un représentant 
plénipotentiaire » de tout l’ensemble des réalisations éventuelles ; 
une réalisation de durée suffisante équivaut à l’ensemble des réali- 
sations de même durée totale. 

Soit maintenant la fonction aléatoire X, (t). Choisissons au hasard 
l’une quelconque de ces réalisations que nous supposons durer un 
temps suffisamment long et calculons sa moyenne temporelle sur tout 
l'intervalle d'observation. De toute évidence les valeurs moyennes 
calculées pour différentes réalisations seront différentes et peuvent 
différer notablement de l’espérance mathématique de la fonction aléa- 
toire calculée comme moyenne d'ensemble. Dans ce cas on dit que 
la fonction aléatoire n’est pas douée de la propriété d’ergodicité. 

Si la fonction aléatoire X (t) est douée de la propriété d’er- 
godicite, sa valeur moyenne temporelle (sur un intervalle de temps 
d'observation suffisant) est approzimativement égale à la moyenne 
d'ensemble d'observations. I] en sera de même pour X* (+1), X (t) > 
x À (t + +), etc. Par conséquent, toutes les caractéristiques de la 
fonction aléatoire (espérance mathématique, variance, fonction de 
corrélation) peuvent être calculées d’une manière approchée d’après 
une seule réalisation suffisamment longue. 

Il est donc important de savoir quelles sont les fonctions qui sont 
douées de la propriété d’ergodicité et quelles sont celles qui ne le 
sont pas. 


Pour élucider cette question nous allons tout d’abord. donner un 
exemple. 

Soit une fonction aléatoire « ({) donnant les variations de l’angie 
d’attaque d’un avion en vol de croisière. Le vol s'effectue dans des 
conditions météorologiques typiques moyennes. Les variations de 
l'angle d'attaque sont provoquées par des perturbations aléatoires 
liées à la turbulence de l’air. La valeur moyenne de l’angle d'attaque 
dépend de l'altitude de vol F7, tout comme l’amplitude des variations 


*) En toute rigueur il faudrait dire non pas « chaque réalisation parti- 
culière » mais « presque chaque réalisation ». Cette restriction est due à l’éven- 


tualité d'apparition de réalisations n’ayant pas cette propriété, mais leur proba- 
bilité est nulle. 
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autour de cette valeur moyenne; en effet, dans les couches basses de 
l'atmosphère la turbulence est plus forte que dans les couches élevées. 
Considérons diverses réalisations de la fonction «& ({) pour une 
altitude donnée Æ. Soumises à l’action d'un même groupe de facteurs 
aléatoires, ces réalisations possèdent les mêmes caractéristiques pro- 
babilistes, la fonction « (f) est donc ergodique (fig. 17.7.3). 


œ(t) 


Fig. 17.7.3 


Considérons maintenant diverses réalisations de « ({) pour toute 
une gamme d’altitudes distribuées suivant une certaine loi (par exem- 
ple, suivant une loi de densité uniforme). Dans ces conditions, la 
fonction « ({), encore que stationnaire, ne sera pas ergodique; ses 
réalisations éventuelles, se produisant avec certaines probabilités, 
diffèrent par le caractère de variations (fig. 17.7.4). 


æœ(t) 


Fig. 17.7.4 


Ce processus aléatoire est décomposable en processus aléatoires 
élémentaires dont chacun a une certaine probabilité de réalisation 
et les caractéristiques particulières. Cette possibilité de développe- 
ment et la non-homogénéité interne du processus aléatoire se déroulant 
de telle ou telle manière avec une certaine probabilité sont la cause 
physique de la non-ergodicité de ce processus. 

En particulier, la non-ergodicité du processus aléatoire peut être 
liée à la présence dans sa composition d’une variable aléatoire ordi- 
naire (c'est-à-dire à la présence dans le spectre du processus aléatoire 
en plus d’une partie continue, d’une variance finie à © = 0). 

Soit la fonction aléatoire: 


ZOH=XO+Y, (17.7.1) 
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où X ({) est une fonction aléatoire stationnaire ergodique de caracté- 
ristiques m., k. (t) et Ÿ une variable aléatoire de caractéristiques m, 
et D,,; supposons de plus que X (f) et Ÿ ne soient pas corrélées. 
Déterminons les caractéristiques de Z (t). En vertu de la loi d’ad- 
dition des fonctions aléatoires (voir $ 15.8) on a: 
My = My + My (17.7.2) 
k, (t) = k, (rt) + D}. (17.7.3) 


Les formules (17.7.2) et (17.7.3) montrent que la fonction aléa- 
toire Z (f) est stationnaire. Mais cette fonction est-elle ergodique ? 


Z(é) 


Fig. 17.7.5 


L'intuition conduit à répondre « non ». Le caractère de chacune de 
ses réalisations est différent et leurs moyennes temporelles sont dé- 
terminées par la valeur prise par la variable aléatoire Y (fig. 17.7.5). 


Fig. 17.7.6 


La forme de la fonction de corrélation permet de juger directe- 
ment si un processus aléatoire est ergodique ou non. Soit la fonction 
de corrélation d’un processus aléatoire non ergodique (17.7.1). Elle 
diffère de la fonction de corrélation de la fonction aléatoire X (f) 
par la présence du terme constant D, (fig. 17.7.6). La fonction de 
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corrélation k, (t) tend vers zéro pour { —> oo (la liaison corrélation- 
nelle entre les valeurs de la fonction aléatoire décroît indéfiniment 
au fur et à mesure de l'augmentation de la distance les séparant), 
par contre la fonction X, (+) ne tend pas vers zéro pour { —> oo mais 
vers la grandeur constante D. 

Dans la pratique on ne peut pas étudier le processus aléatoire et 
sa fonction de corrélation durant un temps infini ; le domaine des 
valeurs de + que nous pouvons envisager est toujours limité. Si la 
fonction de corrélation d’un processus aléatoire stationnaire ne dé- 
croît pas quand t augmente, mais à partir d’une certaine valeur de 
t reste à peu près constante, ceci signifie, en général, que la fonction 
aléatoire contient comme composante une variable aléatoire ordi- 
naire et que donc le processus n’est pas ergodique. Au contraire, lorsque 
la fonction de corrélation tend vers zéro pour £{ —+ oo, ceci témoigne, 
en général, de l’ergodicité du processus. En tout cas, cette condition 
est suffisante pour que l’espérance mathématique de la fonction puisse 
être déterminée comme la moyenne temporelle. 

Dans la pratique souvent on établit qu'un processus aléatoire 
est ergodique non pas en étudiant sa fonction de corrélation pour 
t— oo, mais sur la base de considérations physiques, liées à la nature 
du processus étudié (en particulier, sa « décomposabilité » ou sa 
« non-décomposabilité » en processus élémentaires de types diffé- 
rents apparaissant avec certaines probabilités). 


17.8. Détermination des caractéristiques d'une fonction 
aléatoire stationnaire ergodique d'après 
une seule réalisation 


Soit une fonction aléatoire stationnaire ZX ({) ergodique et sup- 
posons qu’on dispose d’une seule réalisation de cette fonc- 
tion aléatoire mais observée sur un intervalle de temps T suffisam- 
ment important. Dans le cas d'une fonction aléatoire stationnaire 
ergodique, une réalisation suffisamment longue est pratiquement 
équivalente (au sens des propriétés statistiques) à un ensemble de 
réalisations de même durée totale ; les caractéristiques de la fonction 
aléatoire peuvent être déterminées non pas comme les moyennes d’en- 
semble, mais comme des moyennes temporelles. En particulier, pour T 
suffisamment grand, l'espérance mathématique m, peut approxima- 
tivement être calculée par la formule 


T 
1 
MS 7 | z (6) dt‘). (17.8.1) 
rt 
*) Pour simplifier l'écriture on omet dans les notations des caractéristi- 


ques d’une fonction aléatoir> le signe — signifiant qu'on a affaire non pas 
à des caractéristiques mais à leurs estimations. 
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D'une manière analogue, on peut trouver la fonction de corré- 
lation k. (t) pour + quelconque. En effet, par définition, la fonction 
de corrélation n'est rien d’autre que l'espérance mathématique de la 


fonction aléatoire X (t) * (+ +): 
k.(t) = MIX (D À (+ Pl. (17.8.2) 


De toute évidence, cette espérance mathématique peut également être 
calculée comme la moyenne temporelle. 


4 
e 
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ES 
il 
A 


Fig. 17.8.1 


Fixons une valeur de + et calculons comme indiqué la fonction de 
corrélation k,(t). À cet effet il y a lieu de centrer la réalisation x (4) 
étudiée, c'est-à-dire d'en . retrancher l'espérance mathémati- 
que (17.8.1): 


z( = z(t) —m.. (17.8.3) 
Nous allons calculer pour + donné l'espérance mathématique de 


la fonction aléatoire X (£) X ({ + +) comme la moyenne temporelle. 
Il nous faudra opérer non pas sur tout l'intervalle de 0 à T, mais sur 


un segment moindre, car le second facteur X ({ + t) n'est défini 
que pour {+t< T7. 

En calculant la moyenne temporelle par la méthode mentionnée 
on obtient : 
T-t 
| z(L)z(t-+r) dt. (17.8.4) 


U 


k,(t) 


1 
T—7T 


\yant calculé l'intégrale (17.8.4) pour différentes valeurs de + 
un peut approximativement reproduire point par point la marche de 
la fonction de corrélation. 

Dans la pratique on remplace les intégrales (17.8.1) et (17.8.4) 
par des sommes finies. Nous allons expliquer ci-dessous la manière 
de procéder. Divisons l'intervalle d'observation de la fonction aléa- 
toire en parties égales de longueur Af et désignons par fi, £2, . : ., ln 
les milieux des segments obtenus (fig. 17.8.1). Ecrivons l'intégrale 
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(17.8.1) comme une somme d'intégrales sur les segments élémentai- 
res At mettant en facteur devant le signe de l'intégrale la fonction 
z (t) égale dans chaque intégrale à la moyenne x ({;) correspondant au 
centre sur le segment élémentaire. On a approximativement : 


ou 
m=+ D z(ti). (17.8.5) 


D'une manière analogue, on peut calculer la fonction de corrt- 
lation pour des valeurs de t égales à 0, At, 2At, ... Donnons par 
exemple, à la grandeur + la 
Kz (7) valeur 
T = MAI — _… 
Dr et calculons l'intégrale (17.8.4) 
en divisant l'intervalle d'inté- 


gration 
T mi mT _n—m 
at 2at T—1t—=T se T 
Fig. 17.8.2 en n —m segments de même lon- 


gueur Atet en mettant dans chacun 
d’eux en facteur devant l'intégrale la valeur moyenne de la fonction 


z (t) z (t + T). On obtient: 


ke (") = nr a à r 2 z (13) &(litm)s 


ou finalement : 
n-Mm 


+ z (ti) z (tim)- (17.8.6) 


i=1 


mT 
kx ( n 


On mène les calculs de la fonction de corrélation à l’aide de Ja 
formule (17.8.6) pour m = 0, 1, 2, ... successivement jusqu'à 
des valeurs de m pour lesquelles elle devient pratiquement nulle ou 
donne lieu à de faibles oscillations non régulières autour de zéro. 
L'allure générale de la fonction Æ, (+) se trouve reproduite point par 
point (fig. 17.8.2). 

Pour que l'espérance mathématique m, et la fonction de corre- 
lation k, (rt) puissent être déterminées avec une précision suffisante 
il faut que le nombre de points n soit suffisamment grand (une cen- 
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taine et dans certains cas plusieurs centaines). Le choix de la longueur 
du segment élémentaire At se trouve déterminé par le caractère des 
variations de la fonction aléatoire. Dans le cas des variations relati- 
vement lentes, le segment At peut être plus grand que si la fonction 
présente des oscillations brusques et fréquentes. Plus les fréquences 
des oscillations constituant la fonction aléatoire sont élevées, 
plus les points repères doivent être serrés. Il est conseillé de partager 
une période entière de l’harmonique de fréquence la plus élevée en 
environ 5-10 segments élémentaires At. 

Souvent le choix des points repères ne dépend pas de l’expéri- 
mentateur mais se trouve déterminé par la vitesse de l’appareil enre- 
gistreur. Dans ce cas on doit se contenter de traiter les données expé- 
rimentales, sans essayer d'introduire de points supplémentaires entre 
les valeurs observées, car cela n'élèvera pas la précision du résultat 
mais ne fera que compliquer le traitement. 


Exemple. En vel horizontal d’un avion on a enregistré la surcharge 
verticale N (t) agissant sur l'avion, ceci pendant 200 s à des intervalles de 25. 
Les résultats sont résumés au tableau 17.8.1. Supposant le processus de varia- 
tion de la surcharge stationnaire, déterminer approximativement l'espérance 
mathématique de la surcharge m,,, la variance D, et la fonction de corrélation 


Tableau 17.8.1 
{ Surcharge | t Surcharge | t Surcharge | { Surcharge 
8 N (t) 8 N (1) 8 N (t) 8 N (t) 
0 1,0 50 1,0 100 1,2 150 0,8 
2 1,3 52 1,1 102 1,4 152 0,6 
ä 1,1 54 1,9 104 0,8 154 0,9 
6 0,7 56 1,0 106 0,9 | 156 1.2 
8 0,7 58 0,8 408 1,0 | 158 1.3 
40 1,1 60 1,1 110 0,8 160 0,9 
42 1,3 62 1,1 112 0,8 162 1,3 
14 0,8 64 1,2 114 1,4 164 1,9 
16 0,8 66 1,0 116 1,6 166 1,2 
18 0,4 68 0,8 118 1.7 168 1,4 
20 0,3 70 0,8 120 1,3 170 1,4 
22 0,3 72 4,2 122 1,6 172 0,8 
24 0,6 74 0,7 124 0,8 174 0,8 
26 0,3 76 0,7 126 1,2 176 1,3 
28 0,5 78 1,1 128 0,6 178 1,0 
30 0,5 80 1,9 130 1,0 180 0,7 
32 0,7 82 1,0 132 0,6 182 1,1 
34 0,8 84 0,6 134 0,8 181 0,9 
36 0,6 86 0,9 136 0,7 186 0,9 
38 1,0 88 0,8 138 0,9 188 1,1 
40 0,5 90 0,8 140 1,3 190 1,2 
42 1,0 92 0,9 142 1,5 192 1,3 
44 0,9 94 0,9 144 1,1 194 1,3 
46 1,4 96 0,6 146 0,7 196 1,6 
48 1,4 98 0,4 148 1,0 198 1,5 
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normée pn (t). Approcher p}, (t) par une fonction analytique, trouver et repré- 
senter graphiquement la densité spectrale du processus aléatoire. 
Solution. En vertu de la formule (17.8.5) on a: 


100 


S Nu) 
ii 
MmN = 100 & 0,98. 
Puis il y a lieu de procéder au centrage de la fonction aléatoire (tableau 17.8.2). 
Tableau 17.8.2 

t t t ° 

: N (1) | ; N (4) | : | N (#) d N (0) 
0 0,02 50 0,02 100 0,22 150 —0,18 
2 0,32 52 0,12 102 0,42 152 —0,38 
4 0,12 54 0,52 104 —0,18 154 —0,08 
6 —0,28 56 0,02 106 —0,08 156 0,22 
8 —0,28 58 —0,18 108 0,02 158 0,32 
10 0,12 60 0,12 110 —0,18 160 —0,08 
12 0,32 62 0,12 112 —0,18 162 0,32 
14 —0,18 64 0,22 114 0,42 164 0,52 
16 —0,18 66 0,02 116 0,62 166 0,22 
18 —0,58 68 —0,18 118 0,72 168 0,42 
20 —0,68 70 —0,18 120 0,32 170 0,42 
22 —0,68 72 ,22 122 0,62 172 —0,18 
24 —0,38 74 —0,28 124 —0,18 174 —0,18 
26 —0,68 76 —0,28 126 0,22 176 0,32 
28 —0,48 78 0,412 128 —0,38 178 0,02 
30 —0,48 80 0,52 130 0,02 189 —0,28 
32 —0,28 82 0,02 132 —0,38 182 0,12 
34 —0,18 84 —0,38 134 —0,18 184 —0,08 
36 —0,38 86 —0,08 136 —0,28 186 —0,08 
38 0,02 88 —0,18 138 —0,08 188 0,12 
40 —0,48 90 —0,18 140 0,32 190 0,22 
42 0,02 92 —0,08 142 0,52 192 0,32 
44 —0,08 94 —0,08 144 0,12 194 0,32 
46 0,42 96 —0,38 146 —0,28 196 0,62 
48 0,42 98 —0,58 148 0,02 198 0,52 


. En élevant au carré toutes les valeurs N (t) et en divisant la somme des 
carrés par n — 100 on obtient la valeur approchéc de la variance de NW (t): 


100 


SIN (CP 


__i=i 
et l'écart quadratique ie 
= 0,323. 
En multipliant entre elles les valeurs N (1) séparées par l'intervalle tr = 2, 4, 
6, ... et en divisant . a des produits respectivement par n — 1 — 99 : 


n—2—=9%8:n—3— . ., on obtient les valeurs de la fonction de corré- 
lation k, (o). On And à la normalisation de la fonction de corrélation en 
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divisant ses valeurs par Di — 0,1045 ce qui donne le tableau des valeurs de la 
fonction p} (t) (tableau 17.8.3). 
Tableau 17.8.3 


T | ON (T) | où (T) me —@ (T) 
0 1,000 1,000 
2 0,505 0,598 
à 0,276 0,358 
6 0,277 0,214 
8 0,231 0,128 
10 —0,015 0,077 
12 0,014 0,046 
14 0,071 0,027 


Le graphique de la fonction px (x) est donné sur la figure 17.8.3 par des 
points réunis par une ligne en pointillé. Les i larités de la fonction de 
corrélation peuvent s'expliquer par l'insuffisance des données expérimentales 


LOS 


-1 0 L 


Fig. 17.8.3 Fig. 17.8.4 


durée insuffisante de l'expérience). On continue le calcul de p} (rt) jusqu'à 
es valeurs de + pour lesquelles la relation corrélationnelle ne se manifeste 
pratiquement plus. 

Afin de lisser les oscillations nettement irrégulières de la fonction p,, (t) 
Che expérimentalement, on approche cette dernière par une fonction du 
ype: 

py(m=er "il, 

où le paramètre « est choisi selon la méthode des moindres carrés (voir 8 14.5). 
Cette méthode donne & = 0,257. Calculant les valeurs de la fonction pN (+) 
pour t = 0, 2, 4, ... (dernière colonne du tableau 17.8.3) on construit la 
courbe approchée (ligne continue sur la figure 17.8.3). 

En utilisant pour la fonction de corrélation l'expression approchée (17.8.6) 
on obtient (voir $ 17.4, exemple 1) la densité spectrale normée: 


a _. 0,257 
n(a2+o2) x(0,2572+w2) ? 
dont la courbe est donnée par la figure 17.8.4. 


S£ (w)= 


CHAPITRE 18 


NOTIONS DE BASE DE LA THÉORIE 
DE L'INFORMATION 


18.1. Problèmes de base de la théorie 
de l'information 


La théorie de l'information a pour objet d'étude les lois quantita- 
tives liées à l'obtention, la transmission, le traitement et la conser- 
vation de l'information. Née dans les années quarante du siècle cou- 
rant des problèmes pratiques des télécommunications, la théorie de 
l'information devient à l’heure actuelle l'outil mathématique indis- 
pensable pour l'étude des processus de commande les plus divers. 

Le caractère aléatoire inhérent aux processus de transmission de 
l'information implique l’utilisation des méthodes statistiques pour 
l'étude de ces processus. Pourtant on ne peut pas se limiter aux mé- 
thodes classiques de la théorie des probabilités et des notions proba- 
bilistes nouvelles doivent être introduites. C’est pourquoi la théorie 
de l'information n’est pas une simple application des méthodes sta- 
tistiques mais doit être considérée comme une branche de la théorie 
des probabilités. | 

L'obtention, le traitement, la transmission et la conservation de 
toute sorte d'informations ont lieu dans tout système de commande. 
Dans le processus de commande il y a toujours échange d’informa- 
tion entre les différentes parties du système. Un exemple simple est 
la transmission de l'information du dispositif de commande à l’or- 
gane d'exécution (transmission des commandes). Un exemple plus 
compliqué est un circuit ferme de commande où l'information con- 
cernant les résultats d'exécution des commandes est transmise au 
dispositif de commande à l’aide d’une réaction. 

Pour être transmise, l'information doit être convenablement 
« codée », c’est-à-dire traduite en une langue de symboles ou de si- 
gnaux spéciaux. Les signaux transmettant l'information peuvent 
être des impulsions électriques, des oscillations lumineuses ou sonores, 
des déplacements mécaniques, etc. 

L'un des problèmes de la théorie de l'information est la recherche 
des méthodes les plus économiques de codage permettant de transmet- 
tre une information donnée à l’aide d'une quantité minimale de sym- 
boles. On résout ce problème tant en présence qu’en l'absence de défor- 
mations (bruits) dans le canal de transmission. 
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Dans le second problème typique de la théorie de l'information 
on dispose d’une source d’information (émetteur) à émission continue 
et d’un canal de transmission par lequel cette information est trans- 
mise à un récepteur. Il y a lieu de trouver le débit de passage du canal 
de façon à assurer la transmission de toute l'information sans retard 
ni déformations. 

Dans un certain nombre de problèmes de la théorie d'information 
il s'agit de déterminer la capacité des mémoires destinées à la con- 
servation de l'information, de trouver les méthodes d'introduction 
et d'extraction de l'information de la mémoire sous la forme conve- 
nable pour l’utilisation directe. 

Pour pouvoir résoudre ces problèmes il faut avant tout savoir me- 
surer le volume de l'information transmise et conservée, la capacité 
de transmission des canaux et leur sensibilité aux bruits (déforma- 
tions). Les notions de base de la théorie d’information exposées dans 
le présent chapitre permettent de donner une description quantitative 
des processus de transmission de l’information et de trouver certaines 
lois mathématiques régissant ces processus. 


18.2. Entropie comme mesure du degré d'incertitude 
de l’état d’un système physique 


Les communications que nous rencontrons dans la théorie de l’in- 
formation sont toutes un ensemble de données concernant un certain 
système physique. Par exemple, à l'entrée d’un système de commande 
automatique d’un atelier industriel peut arriver une communication 
sur le pourcentage normal ou trop élevé de rebut, sur la composition 
chimique d’un matériau ou la température d’un four, etc. Toutes 
ces communications décrivent l’état d'un système physique. 

Il est évident que si l’on connaissait l’état d’un système physique 
toute transmission de l'information serait inutile. La communication 
n’a de sens que si l’état du système est inconnu d'avance, aleatoire. 

Convenons alors que l'information transmise concerne un certain 
système physique À pouvant se trouver occasionnellement dans un 
état quelconque, c’est-à-dire un système caractérisé par un certain 
degré d'incertitude. Il est évident que les renseignements que l’on 
obtiendra sur le système seront d'autant plus importants que l’incer- 
titude du système avant la réception de ces renseignements (« a pri- 
ori ») était grande. On se pose alors tout naturellement la question 
suivante : que signifie un degré d incertitude plus ou moins grand et 
comment peut-il être mesuré ? 

Pour répondre à cette question nous allons tout d'abord com- 
parer entre eux deux systèmes caractérisés chacun par une certaine 
incertitude. 

Soit le premier système une pièce de monnaie qui, jetée en l'air, 
peut se présenter par l’un des deux côtés : pile ou face. Le second sys- 
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tème est un dé ayant six états possibles : 1, 2, 3, 4, 5 et 6. Lequel 
des deux systèmes a l'incertitude plus grande? Il est évident que 
c'est le second car le nombre de ses états possibles est plus important ; 
notons de plus que ces états sont équiprobables. 

On pourrait croire que le degré d'incertitude est déterminé par 
le nombre d'états possibles du système. Montrons qu’en général ce 
n'est pas vrai. Considérons, par exemple, un dispositif technique 
pouvant avoir deux états : bon état de marche et défaillance. Suppo- 
sons que la probabilité a priori de fonctionnement sans défaillance 
soit 0,99 et la probabilité de défaillance 0,01. Le degré d'incertitude 
de ce système est très faible : on peut dire d'une manière presque cer- 
taine que le dispositif fonctionnera convenablement. Lorsque l’on 
jette une pièce de monnaie il y a également deux états possibles mais 
le degré d'incertitude est bien plus important. On voit ainsi que le 
degré d'incertitude d'un système physique est déterminé non seule- 
ment par le nombre de ses états possibles, mais également par la proba- 
bilité des états. 

Passons maintenant au cas général. Soit un système X pouvant 
prendre un nombre fini d'états 21, z>, . . ., x, avec les probabilités 
respectives Di, P2s + + -> Pn OÙ 


pa=P(X-— 2x) (18.2.1) 


est la probabilité pour le système X de se trouver dans l’état zx, (le 
symbole À — zx; désigne ‘que le système se trouve dans l'état zx;). 


On a de toute évidence 3 Pi = 1. 


Arrangeons ces données dois la forme d’un tableau où dans la ligne 
supérieure nous marquons les états possibles du système, et dans la 
ligne inférieure les probabilités correspondantes : 


Ce tableau ressemble à celui de la répartition d’une variable aléa- 
toire discrète X dont les valeurs possibles x, z2, . .., x, ont les 
probabilités pi, p2, . . ., p\A. En effet, il y a beaucoup de commun en- 
tre un système physique À à un nombre fini d'états et une variable 
aléatoire discrète ; pour que le premier soit équivalent à la seconde il 
suffit d'attribuer à chacun des états une certaine valeur numérique 
(par exemple, le numéro de l'état). Il faut souligner que, pour décrire 
le degré d'incertitude, peu importe quelles sont les valeurs z;, z2, . .. 
.... Zn qui se trouvent dans la ligne supérieure du tableau, seul im- 
porte le nombre de valeurs et leur probabilité. 
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Pour la mesure d'incertitude a priori d’un système (ou d’une varia- 
ble discrète X) on utilise en théorie de l'information une caracté- 
ristique spéciale appelée entropie. L'entropie est la notion fonda- 
mentale de la théorie de l'information. 

On appelle entropie d'un système la grandeur 


ñn 
H(X)= — À pu log pi (18.2.2) 


qui est la somme des produits des probabilités des différents états 
du système par les logarithmes de ces probabilités prise avec le signe 
inverse *). 

Comme nous allons le voir l’entropie H (X) jouit d’un certain nom- 
bre de propriétés justifiant son utilisation en qualité de caractéristi- 
que du degré d'incertitude. Tout d’abord elle s’annule lorsque l’un 
des états est certain, les autres étant impossibles. Puis, pour un nom- 
bre donné d'états elle est maximale lorsque ces états sont équiproba- 
bles, et augmente avec le nombre d'états. Enfin, et c’est là peut-être 
l'essentiel, l’entropie est additive, c’est-à-dire que lorsque plusieurs 
systèmes indépendants se trouvent réunis en un seul leurs entropies 
s'ajoutent. 

La base a du logarithme dans la formule (18.2.2) peut être quel- 
conque supérieure à 4. Le changement de base équivaut à une simple 
multiplication de l’entropie par un nombre constant et le choix de 
la base est le choix d’une certaine unité de mesure de l’entropie. Si l’on 
choisit pour base le nombre 10, on parle d'unités décimales de l'en- 
tropie, si c’est le nombre 2, les unités de mesure sont binaires. En pra- 
tique, le plus simple est d'utiliser des logarithmes de base 2 et donc 
de mesurer l’entropie en unités binaires ; ceci s'accorde bien avec le 
système binaire de représentation des informations dans les calcula- 
trices électroniques. 

Ultérieurement, sauf mention spéciale, par le symbole log on enten- 
dra des logarithmes binaires. 

Dans l'annexe (table 6) on trouvera les logarithmes binaires 
des nombres entiers de 1 à 100 **). 

Il est facile de voir que lorsque 2 est pris pour base des logarith- 
mes, l'unité de mesure de l’entropie est l’entropie d'un système 


*) Le signe moins devant lasommea pour but de rendre positive la valeur 
AT (les nombres p, étant inférieurs à l'unité, leurs logarithmes sont 
négatifs). 

++) Les logarithmes des fractions se trouvent par soustraction, par exemple: 


log 0,13 = log 13 — log 100. 


Pour trouver les logarithmes à trois chiffres significatifs on peut utiliser l'’inter- 
polation linéaire. 


456 NOTIONS DE BASE DE LA THÉORIE DE L'INFORMATION (CH. 18 


simple À ayant deux états équiprobables: 


Pil 5 
En effet, la formule (18.2.2) donne: 
1 1 1 1 


L'unité d’entropie ainsi obtenue est appelée unité binaire ou bit 
(de l'anglais « binary digit »—chiffre binaire). C’est l’entropie d’un 
rang d'un nombre binaire pouvant avec la même probabilité être 
égal à zero ou à Jl’unité. 

Nous allons mesurer en unités binaires l’entropie d’un système X 
ayant x états équiprobables : 

Lo Th 


"| : .…. e 


Pi 


El 1 
n n 


H (X) = —n À log += — log 1+logn 


ou 
H(X) = log n, (18.2.3) 


ce qui traduit le fait que l'entropie d'un système à états équiprobables 
est égale au logarithme du nombre d'états. 

Par exemple, l'entropie d’un système à huit états est H (X) — 
= log 8 = 3. 

Montrons que lorsque l'état du système est connu d’avance, son 
entropie est nulle. En effet, dans ce cas toutes les probabilités 
Pis P2s + + +» Pn dans la formule (18.2.2) sont nulles, sauf une, par 
exemple p,, qui est égale à l’unité. Le terme p, log p, s’annule car 
log 1 = 0.-Les autres termes sont également nuls car 


lim p log p — 0. 
p—0 


Montrons que l’entropie du système à un nombre fini d'états est 
maximale lorsque tous les états sont équiprobables. A cet effet, con- 
sidérons l’entropie (18.2.2) comme une fonction des probabilités 
Pis P2s + + + Pn et trouvons l'extrémum conditionnel de cette fonc- 
tion pour la condition 


2 pr=1. (18.2.4) 
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En utilisantla méthode des multiplicateurs indéterminés de Lagrange 
cher chons l'extrémum de la fonction 


F — — à Pi log Pi + À 2 Pi- (18.2.5) 


En dérivant (18.2.5) par rapport à p:, -.., p, et en annulant les 
dérivées on obtient le système suivant d'équations: 


log pi + loge+i=0 (i—=1,...,n) 
ou 
log p; = —À — loge (i—=1,...,n), (18.2.6) 


ce qui montre que l’extrémum (ici le maximum) correspond à des 
P: égales entre elles. En vertu de la condition (18.2.4) on a 


1 
Pi = Pa= = Pn=T (18.2.7) 


et l’entropie maximale du système 
Hss (X) — log n, (18.2.8) 


c'est-à-dire que la valeur maximale de l’entropie d’un système à 
un nombre fini d'états est égale au logarithme du nombre d'états 
et correspond à des états équiprubables. 

Le calcul de l’entropie d’après la formule (18.2.2) peut être quel- 
que peu simplifié par l'introduction de la fonction spéciale 


n @) = —p log p, (18.2.9) 


où le logarithme est de base 2. 
La formule (18.2.2) devient alors: 


H(X) = 2 n (pi). (18.2.10) 


La fonction n (p) est tabulée, ses valeurs pour 0 << p < 1 sont 
données de 0,01 en 0,01 dans l’annexe (table 7). 


Exemple 1. Un système physique (un appareil) se compose de deux 
parties I et 11. Dans chacune de ces parties un défaut peut survenir indépen- 
damment de l’autre. Après un certain temps de fonctionnement le me 
peut se trouver dans l’un des quatre états suivants: 

1) les deux parties fonctionnent ; 

2) la partie I fonctionne et la partie II est en défaut; 

3) la partie I est en défaut et la partie 11 fonctionne; 

4) les deux parties sont en défaut. 

Les probabilités de ces différents états sont respectivement 0,6, 0,25, 0,1 
et 0,05. Trouver l’entropie du système. 
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Solution. Représentons les conditions du problème par un tableau: 


pi | 0,6 0.2 | 0,1 | 0.08 


En vertu de la formule (18.2.10) on a: 
H(X) = n (0,6) + n (0,25) + n (0, 1) + n (0,05). 
En utilisant la table 7 de l'annexe on a: 
H (X) = 0,4422 + 0,5000 + 0,3322 “+ 0,2161 = 1,49 bit. 


Exemple 2. Trouver l’entropie d’un système dont l'état est donné 
par la loi de répartition d'une variable aléatoire discrète X : 
ZT! Zi Z2 


Z3 Z« 


T4 


pi | 0,01 | 0,01 | 0,01 


0,01 | 0,96 
Solution. 
H (X) = 4n (0,01) + n (0,96) = 0,322 bit. 


Exemple 3. Trouver l’entropie maximale d’un système se composant 
de trois éléments, pouvant se trouver chacun dans quatre états éventuels. 

Solution. Le nombre total d'états possibles du système est égal à 
n = 4.4.4 = 64. L entropie maximale du système est égale à log 64—6 bits. 

Exem p le 4. Trouver l’entropie maximale d'une communication de 
cinq lettres, le nombre de lettres de l'alphabet étant égal à 32. , 

Solution. Le nombre d'états possibles du système est nr — 325. L entro- 
pie maximale est égale à 5 log 32 = 25 bits. 


La formule (18.2.2) [ou (18.2.10) qui lui est équivalente] permet 
de calculer directement l'entropie. Cependant pour les transforma- 
tions il est plus commode d'écrire l'entropie comme l'espérance ma- 


thématique : 
H (X) = M [—-log P (X)}, (18.2.11) 


où log P (X) est le logarithme de la probabilité d’un état quelconque 
(aléatoire) du système, considéré comme une variable aléatoire. 

Aux états Zi, Z2, . . ., Zn du système X correspondent les valeurs 
suivantes de la variable aléatoire log P (X): 


log p1, 108 P2, - - ., 10g Pa. (18.2.12) 


Il est facile de voir que la valeur moyenne (espérance mathématique) 
de la variable aléatoire —log P (X) est justement l’entropie du systè- 
me À. Pour la trouver, il y a lieu de prendre la moyenne pondérée 
des valeurs (18.2.12), avec des poids égaux aux probabilités corres- 
pondantes Di, P2, + + +» Pn- 
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Les formules analogues à (18.2.11) où l’entropie est écrite comme 
une espérance mathématique permettent de simplifier les opérations 
impliquant l’entropie en les réduisant à l'emploi familier des théorè- 
mes bien connus sur les espérances mathématiques. 


18.3. Entropie d’un système composé. Théorème 
de composition des entropies 


Dans la pratique souvent il y a lieu de déterminer l’entropie d’un 
système composé obtenu par réunion de deux au plusieurs systèmes 
simples. 

On entend par réunion de deux systèmes X et Ÿ d'états possibles 
Lis + + + Tn3 Yts + + + Ym UD Système composé (X, Ÿ’) dont les états 
(Z:, ys) Sont toutes les combinaisons possibles des états z;, y; des 
systèmes X et Y. 

Il est évident que le nombre d'états possibles du système (X, Ÿ) 
est égal à r X m. Désignons par P;; la probabilité pour le système 
(X, Ÿ) de se trouver dans l’état (zx;, y): 


Py=P((X- x) (Y — y). (18.3.1) 


Il est commode de disposer les probabilités P,; sous la forme d'un 
tableau (matrice): 


Nous allons calculer maintenant l’entropie d’un système composé. 
Par définition elle est égale à la somme prise avec le signe inverse 
des produits des probabilités de tous les états possibles par leurs loga- 
rithmes respectifs : 


H(X, Y) — — à 2 P;; log P;; (18.3.2) 
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ou en changeant de désignations: 


n m 
H(X, Y)= 2 à n (Pi). (18.3.2’) 
i= 2= 
L'entropie d’un système composé, tout comme celle d’un système 
simple, peut s’écrire comme une espérance mathématique, soit : 


H(X, Y) = Ml-—log P (X, Y)l, (18.3.3) 


où log P (X, Y), logarithme de la probabilité de l’état du système, 
est considéré en tant que variable aléatoire (fonction d'état). 

Supposons que les systèmes X et Y soient indépendants, c'est-à- 
dire que leurs états puissent être réalisés indépendamment les uns des 
autres, et calculons dans cette hypothèse l’entropie du système com- 
posé. En vertu du théorème de multiplication des probabilités des 
événements indépendants on a: 


P(X, Y)=P(X) P (»), 


log P (X, Y) = log P (X) + log P (F7). 
La substitution dans (18.3.3) donne: 
H(X,Y) = M[—log P (X) — log P (Y)), 


H(X, Y) = H(X) + H (Y), (18.3.4) 


c'est-à-dire qu'à la réunion des systèmes indépendants leurs entropies 
s'ajoutent. 
La proposition démontrée est le théorème d'addition des entropies. 
Le théorème d'addition des entropies peut facilement être géné- 
ralisé à un nombre arbitraire de systèmes indépendants: 


d'où : 


ou 


H(X, XX) => H (X3). (18.3.5) 


Si les systèmes ne sont pas indépendants le théorème d’addition 
des entropies n’est plus applicable. Dans ce cas l'entropie d’un systè- 
me compose est inférieure à l’entropie totale des composantes. Pour 
trouver l’entropie du système formé d'éléments dépendants il y a lieu 
d'introduire la notion nouvelle d'entropie conditionnelle. 


18.4. Entropie conditionnelle. Réunion 
de systèmes dépendants 


Soient deux systèmes X et Y, dans le cas général dépendants l’un 
de l’autre. Supposons que le système X se trouve dans l'état z.. 
Désignons par P (y; | x:) la probabilité conditionnelle pour le système 
Ÿ de se trouver dans l’état y; lorsque le système X se trouve dans l’état 
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Zi: 


P{ylz) = PF ylX - x). (18.4.1) 


Déterminons l’entropie conditionnelle du système Y lorsque le système 
X se trouve dans l'état x;. Désignons-la par H (Y | x;). Par définition : 


HF |zxi) = T2 P (y; x) log P (y;| x:) (18.4.2) 
ou 


H(Y |zi) = À n(P (y;lzxi)). (18.4.2') 


On peut écrire la formule (18.4.2) sous la forme d'une espérance 
mathématique, soit : 


H(Y|z)=M;,1—1log P (Y]|zxi)], (18.4.3) 


où Af,, est l'espérance mathématique conditionnelle de la grandeur 


entre parentièses, pour la condition À — x;. 

L'entropie conditionnelle dépend de l'état r; du système À. 
Calculons l'entropie moyenne, ou totale, du système Ÿ compte tenu 
du fait que le système peut prendre des états différents. À cet effet 
il y a lieu de multiplier chacune des entropies conditionnelles (18.4.2) 
par la probabilité de l’état correspondant p; et d'ajouter tous ces pro- 
duits. Désignons par H (Y | X) l’entropie conditionnelle totale, on a: 


H(Y|X) => PiH (Y, xi) (18.4.4) 
ou, compte tenu de la formule (18.4.2) : 
H(Y|2X)= —È Pi À PI: log P (y;|zi). 
En portant p,;, sous le second signe somme, on a: 


HYIX = D mPUlz)logP Qu) (18.45) 


ou 
n mm 


H(YIX)= 2 2 pm(P (li). (18.4.5°) 


1-==1 J=1 
En vertu du théorème de multiplication des probabilités on a: 
: piP (yslzi) = Pis, 
par consequent : 


H(Y|X) = — à à Piylog P (y;|xi). (8.4.6) 
i=1 J= 
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On peut écrire l’expression (18.4.6) comme une espérance mathé- 


matique, soit: 
H(Y IX) = Ml-1log P (Y | X)]. (18.4.7) 


La grandeur H (Y | X) caractérise le degré d'incertitude du systè” 
me Ÿ connaissant l’état du système X. Nous l’appellerons entropie 
totale du système Y conditionnellement à À. 


0,1 [o,2 | 0 |o,3 


" | 0 [os | 0 |o,3 


pa = 0,1; p2=0,7; ps = 0,2. 

Ecrivons ces probabilités dans la ligne supplémentaire du tableau. D'une ma- 
nière analogue, en ajoutant les P,; ligne par ligne on trouve les r,; = P (Y — y;): 
r = 0,3; r2= 0,3; rs = 0,4, 
que l’on porte dans la colonne droite du tableau ci-dessus. En divisant les P;; 
par p; on obtient un tableau pour les probabilités conditionnelles P (y, | x;): 


« 
«" 


0,3 

PE | 0 | 03 | ° 
0,2 

y3 | 0 0,7 1 


La formule (18.4.5’) permet de trouver H (Y | X). Les entropies condi- 
tionnelles étant nulles pour X — zx, et À — x; On a: 


mo =0,7 [1 (65) +7 (6) +7 (05) ]- 
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En utilisant la table 7 de l'annexe on trouve: 
H (Y |X) = 1,09 bit. 


D'une manière analogue on peut trouver H (X | Y). En intervertissant X 
et Y dans la formule (18.4.5’) on a: 


H(X|Y)= à rn (P (zil vs). 
2= 


Composons 10 tableau des probabilités conditionnelles P (zx; | y;). En divisant 
les P;; par r; on obtient: 


D'où 
0,1 0,2 0,2 0,2 : 

a RIN=03 [a (73) +0 (63) ]+04 [n (oi) +n (03) ] + 0.68 it 

En utilisant la notion d'entropie conditionnelle on peut exprimer 
l’entropie d'un système composé en fonction des entropies de ses com- 
posantes. 

Nous allons démontrer le théorème suivant : 

L'entropie d'un système, composé de systèmes X et Ÿ, est égale à 


l'entropie d'une de ses composantes plus l'entropie conditionnelle de 
l'autre par rapport à la première: 


H(X,Y)=H(X)+H(Y |X). (18.4.8) 
U8S An écrire AH (X, Ÿ) comme l'espérance mathématique 
.3.3) : 
H(X, Y)=MIl-log P (X, Y)]. 
En vertu du théorème de multiplication des probabilités on a: 
P(X Y =P(X)P(TIX), 
par conséquent : 


log P (X, Y) = log P (X) + log P (Y | X). 
d'où : 
H(X, Y) = MI-log P (X)] + M [—log P (Y | X}] 
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ou en vertu des formules (18.2.11), (18.3.3) on a: 
: H(X, Y)=H(X)+H(Y IX), 
ce qu'il fallait démontrer. | 
En particulier, lorsque les systèmes X et Y sont indépendants, 
H (Y | À) = H (Y) et l’on obtient le théorème d'addition des entro- 
pies démontré dans le paragraphe précédent, à savoir : 


H(X, Y) = H(X) + H "). 
Dans le cas général : 
H(X, Y)<H(X) + H (r). (18.4.9) 


La relation (18.4.9) exprime le fait que l’entropie totale condition- 
nelle Z7 (Y | À) ne peut être supérieure à l'’entropie incondition- 
nelle : 


H(Y]|X)<H(Y). (18.4.10) 


Nous démontrerons l'inégalité (18.4.10) au $ 18.6, bien qu'in- 
tuitivement elle soit évidente: le degré d'incertitude d'un système 
ne peut pas augmenter du fait que l’on connaît l’état d’un autre 
système. 

En vertu de la relation (18.4.9) l’entropie d’un système composé 
est maximale dans le cas limite, lorsque ses composantes sont indé- 
pendantes. 

Considérons maintenant l’autre cas limite, lorsque l’état d’un 
système (par exemple X) détermine entièrement l’état de l’autre 
système Y . Dans ce cas H (Y | À) = 0 et la formule (18.4.7) donne: 


H(X, Ÿ) = H(X). 

Si l’état de l’un des systèmes X, Ÿ détermine d’une manière 
univoque l’état de l’autre et inversement (le cas des systèmes équi- 
valents), on a: 

H(X, Y) = H(X) = 4H (r). 


Le théorème de l’entropie d'un système composé peut être faci- 
lement généralisé à un nombre quelconque de systèmes : 


H (Aus as ces Xo) = H (X) + A (X21 X1) + H (Ka as Xe) + 
he HOUR E A Au) (18.4.11) 


où l’entropie de chaque système est calculée en supposant que l’état 
de tous les systèmes précédents soit connu. 


18.5. Entropie et information 


Dans les paragraphes précédents nous avons défini l’entropie com- 
me la mesure d'incertitude de l’état d'un système physique. Il est 
évident que si l’on apprend certaine information sur le système 
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cette incertitude diminue. Plus on a de données, plus ces dernières 
sont complètes, plus l'information dont on dispose sur le système 
est grande et moindre est l'incertitude de son etat. Il semble donc 
tout naturel de mesurer la quantité d'information par la diminution 
de l’entropie du système dont les données en question précisent l’état. 
Soit un certain système X ; nous allons estimer l'information 
accumulée au fur et à mesure que l’état du système X devient connu. 
Avant que l’on ait ces données, l’entropie (a priori) du système était 
H (X); après l’obtention des données l’état du système s’est entie- 
rement déterminé, c’est-à-dire que l'entropie est devenue égale à 
zéro. Désignons par 7x l'information obtenue avec la détermination 
de l’état du système X, évidemment, elle est égale à la diminution 
de l'entropie: 
ou 


Ix = H(X), (18.5.1) 


c'est-à-dire que la quantité d'information acquise lorsque l'état d'un 
système physique devient entièrement connu est égale à l'entropie de 
ce système. 

Ecrivons la formule (18.5.1) comme suit: 


n 
Ix = 2 pilog pa, (18.5.2) 
où pj = P(X = zx). 

La formule (18.5.2) signifie que l'information Zxest la valeur 
moyenne du logarithme de la probabilité d'état prise sur tous les 
états du système et avec le signe inverse. 

Remarquons que pour obtenir Zx il y a lieu de multiplier log p; 
(logarithme de la probabilité de l’état à) pris avec le signe moins, par 
la probabilité de cet état puis d'ajouter tous ces produits. Il est tout 
naturel de considérer chaque terme —log p;, comme l'information 
fournie par une communication particulière selon laquelle le système 
X se trouve dans l'état z;. Désignons cette information par J,, : 


Tx, = — log pi. (18.5.3) 


L'information J, sera alors l'information moyenne (ou totale) 
obtenue de toutes les communications, compte tenu de leurs proba- 
bilités. La formule (18.5.2) peut s’écrire comme une espérance mathé- 
matique, soit 


Ix = M[—log P (X))], (18.5.4) 
où la lettre X désigne un état quelconque (aléatoire) du système X. 
Comme tous les nombres p;, ne sont pas supérieurs à l'unité, ni 


l'information partielle Z,, ni l'information totale 7x ne peuvent être 
négatives. 


30 —2823 
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Si tous les états possibles du système sont a priori équiprobables 
(ps = Pr =... = Pn = +) , il est évident que l'information Jx. 
de chacune des communications particulières 

Tx,= —log p=logn 
est égale à l'information moyenne (totale): 


1 1 
I x = —n— log —=log nr. 


Dans le cas où les états du système ont des probabilités diffé- 
rentes les informations des diverses communications sont différentes : 
la plus grande information est contenue dans des communications sur 
les événements qui, a priori, étaient les moins probables. Par exem- 
ple, la communication que le 31 décembre à Moscou il a neigé donne 
moins d'information qu'une communication identique de par son 
contenu mais relative au 31 juillet. 


Exemple 1. Une pièce du jeu d'échecs se trouve sur une case d’un 
échiquier. A priori toutes les positions des pièces sont équiprobables. Déterminer 
l'information contenue dans la communication indiquant la case occupée par 
la pièce. 

Fs olution. L'’entropie du système X à n états équiprobables est égale 
à log n; ici: 
Tx = H (X) = log 64 = 6 bits, 
c'est-à-dire que la communication contient 6 bits d’information. Comme tous 
les états du système sont équiprobables, toute communication concrète du 
type « la pièce se trouve sur la case e2» porte la même information. 

Exemple 2. Pour les conditions de l'exemple 1, trouver l’information 
de la communication que la pièce occupe un des coins de l’échiquier. 

Solution. La probabilité a priori de l'état dont il est question est: 


_ 
PT 64 16° 
L'information partielle est égale à: 
1 ’ 
= — log =“ bits. 
Exemple 3. Trouver l'information particulière contenue dans la 


communication d'une personne À rencontrée pour la première fois: « Aujour 


d'hui c’est mon anniversaire ». , : | 
Solution. A priori, tous les jours de l’année ont la même probabilité 


d’être les jours d'anniversaire de la personne 4. La probabilité de la communi- 
cation reçue est p = 2. L'information particulière de la communication 
en question est: 
1 ; 
I= — log: FF 8,51 bits. 
Exemple 4. Dans les conditions de l'exemple 3 trouver l'information 


totale de la communication apprenant qu'aujourd'hui est l'anniversaire ou non 
de la personne À rencontrée pour la première fois. 
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Solution. Le système dont on recherche l'état a deux états possibles : 
z, c'est le jour d'anniversaire et z2, ce n’est pas le jour d’anniversaire. Les 
de : 364 
probabilités respectives de ces états sont p1 = 3? P2 = 3%: 
L'information totale est égale à: 


Ix=H(X)=n (5) +n (5) < 0,063 bit. 


Exemple 5. On tire sur une cible n coups indépendants; la probabili- 
té d’atteindre le but avec un coup est égale à p. Les résultats du tir ne peuvent 
être observés directement. Après le k-ième coup (1 SX < n) on examine la 
cible pour voir si elle a été atteinte ou non; si oui on ne tire plus dessus. 
Trouver k de la condition que la quantité d’information fournie par l’examen 
de la cible soit maximalc. 

Solution. Soit un système physique X, en l'occurrence la cible, après 
le k-ième coup. Les états possibles du système X seront: 


z1, la cible a été atteinte; 
z2, la cible n'a pas été atteinte. 
Les probabilités des états x; et z2 sont données par le tableau: 


(1— p}" 


pa | 1—(1—p}* 


Il est évident que l'information obtenue lors de l'étude du système X 
est maximale lorsque les deux états x; et x: sont équiprobables: 


1—A—p}h= (1 — p}À. 
24—p}h=1; (A — ph = 1/2 
—1 


be 
log (1—p) ? 


en entendant par log le logarithme de base 2. Il est clair que k peut ne pas être 
un entier, il y a alors lieu de l'arrondir au nombre entier le plus proche. Par 
exemple, pour p = 0,2 on a: | 


K= D 3519 


Si on obtient k => n, ceci signifie que l'information maximale sur l’état du 
système est fournie par l'examen de la cible après le dernier coup (k = n). 


D'où 


et 


& 3. 


Si l'information est mesurée en bits on peut lui donner une inter- 
prétation assez simple: c'est le nombre de réponses « oui » et «non» 
fournissant la même information. En effet, soit un système à deux 
états : 


Ti TZ, Lo 


Pi Pi | P2 
30 
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Pour trouver l'état de ce système il suffit de poser une seule ques- 
tion, par exemple de demander si lesystèmese trouve dans l’état x. 
La réponse « oui » ou 4 non » à cette question fournit une certaine 
information, atteignant la valeur maximale 1 lorsque les deux états 
a priori sont équiprobables p; — p2 = 1/2. Ainsi l'information maxi- 
male donnée par la réponse « oui» ou «non» est égale à un 
bit. 

Si l'information obtenue d’une communication est égale à n 
bits, elle est équivalente à l’information donnée par n réponses « oui » 
ou « non » à des questions posées de telle sorte que les « oui »ete non» 
soient équiprobables. 

Dans certains cas simples pour déterminer le contenu d'une 
information on arrive à poser des questions de telle sorte que les 
réponses « oui » et «non» à ces questions soiert équiprobables. 
Dans ces cas l'information reçue se mesure par le nombre de ques 
tions posées. 

S'il n'est pas possible de poser les questions de cette façon, on 
peut affirmer seulement que le nombre minimal de questions indis- 
pensables pour élucider le contenu de la communication donnée 
n'est pas inférieur à l'information contenue dans la communication. 
Pour que le nombre de questions soit minimal il y a lieu de les formu- 
ler de telle sorte que les probabilités des réponses « oui » ou « non » 
soient les plus voisines possibles de 1/2. 


Exempie 6. Quelqu'un a pensé à un nombre X tel que 
1SX<8. 


Il y a lieu de trouver ce nombre en posant un nombre minimal de questions 
auxquelles il faudra répondre « oui » ou « non. 

Solution. Déterminons l'information contenue dans la communica- 
tion ci-dessus. À priori toutes les valeurs de X, de 1 à 8, sont équiprobables, 
donc psy = Ps = .-.. —= pg = 1/8 et la formule (18.5.2) donne: 


Ix= log 8 = 3. 


Le nombre minimal de questions qu'il faudra poser pour trouver le nombre 
retenu est ainsi non inférieur à trois. 

Dans le cas présent trois questions sont effectivement suffisantes, si on les 
formule de telle sorte que les probabilités de réponses « oui » ou « non » soient 
égales. 
: Supposons que c’est le nombre « cinq ». Dans l'ignorance du nombre retenu 
on pose les questions suivantes: 

Question 1. Le nombre X est-il inférieur à cinq? 

Réponse. Non. 

(Conclusion: X est l’un des nombres 5, 6, 7, 8). 
Question 2. Le nombre X est-il inférieur à sept? 
Réponse. Oui. 

(Conclusion: X est l’un des nombres 5, 6). 
Question 3. Le nombre X est-il inférieur à six? 
Réponse. Oui. 

(Conclusion: X est égal à cinq). 
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Il est facile de voir que trois questions de ce genre (ou des questions analo- 
gues) peuvent permettre de trouver un nombre quelconque entre 1 et 8 *). 


Ainsi nous avons appris à mesurer l'information concernant un 
système X contenue tant dans les communications isolées sur son 
état que dans le fait même de poser une question relative à cet état. 
On supposait toujours qu’on observait directement le système X. 
En fait il n’en ait pas toujours ainsi : il peut se faire que le système 
X ne soit pas accessible à l'observation; il y a lieu alors de trouver 
l'état non pas du système X, mais d'un certain autre système Ÿ 
lié au premier. Par exemple, au lieu de suivre directement des cibles 
aériennes, au poste de commande on observe l’écran montrant la situa- 
tion dans l’air ; sur cet écran les cibles sont représentées par des signes 
conventionnels. De même, faute de pouvoir suivre directement un 
navire cosmique on analyse les signaux transmis par son appareillage. 
Encore, au lieu du texte X d’un tclégramme envoyé le destinataire 
lit le texte Y reçu, celui-ci ne coincidant pas toujours avec X. 

Les écarts entre le système XÀ qui nous intéresse et le système 
observé Ÿ peuvent dans le cas général être de deux types: 

1) Les écarts dus à ce que certains états du système X n'ont pas 
d’analogues dans le système Y plus pauvre en détails que le systè- 
me À. 

2) Les écarts dus aux erreurs: erreurs de mesure des paramètres 
du système X et erreurs de transmission des communications. 

À titre d'exemple d'écarts du premier type on peut citer les er- 
reurs d’arrondi des données numériques ou les erreurs dues à la descrip- 
Liun grossière des propriétés du système X par le système Y. Un 
exemple d’écarts du second type est fourni par les déformations des 
signaux à cause des bruits dans les canaux de transmission, à cause 
des défectuosités d’appareillage, d'erreurs d'étourderie des opéra- 
teurs participant à la transmission, etc. 

Lorsque le système nous intéressant X et le système observé Y 
sont differents, il y a lieu de connaître la quantité d'information sur 
le système X donné par l'observation de Y. 

Il est tout naturel de définir cette information comme une dimi- 
nution de l'entropie du système X avec l'obtention des renseignements 
concernant l'etat du système Y : 


Iy-x=H(X)—H(X|Y). (18.5.5) 


En effet avant la réception des données concernant le système Y 
l'entropie du système X était Æ (X); après la réception de ces don- 
nées l’entropie restante est devenue H (X | Y); l'entropie détruite 
par les données est l'information 7} x. 


*) On recommande au lecteur de poser six questions indispensables pour 
déterminer la position de la pièce sur un échiquier (voir exemple 1) et de trouver 
le nombre de questions nécessaires pour déterminer la carte retenue dans un 
jeu de 36 cartes. 
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Nous appellerons la quantité (18.5.5) information totale (ou moyen- 
ne) sur le système X contenue dans le système Y. 
Nous allons montrer que 


Iyx = Ixey; 


c'est-à-dire que chacun des deux systèmes contient sur l’autre la même 
information totale. 

Pour la démonstration nous allons écrire l’entropie du système 
(X, Y) conformément au théorème (18.4.8) par deux formules équiva- 
lentes : 


H(X, Y) = H(X) + H(Y 12), 
H(X, Y=HM+H(XIY), 


H(X)+HYIX)=HF)+H(XI"), 
H(X}—H(X|IY)=H(Y)—-H(YIX). 


DJ 


d'où : 


ou 
Tyex = Txey, (18.5.6) 


co qu'il fallait démontrer. 
Introduisons la désignation: 


Ivex = Zlyex = 1x (18.5.7) 


et appelons l'information 1y.,x l'information mutuelle totale contenue 
dans les systèmes X et Y. 

Voyons maintenant ce que devient l'information mutuelle totale 
dans les cas limites où les systèmes sont nettement indépendants ou 
étroitement liés. Si À et Y sont indépendants on a: 

L H(YIX) = H (7) 
e 


TIy..x=0, (18.5.8) 


c’est-à-dire que l'information totale mutuelle contenue dans les systè- 
mes indépendants est nulle. Ce résultat est tout naturel car on ne peut 
recueillir de renseignements sur un système en observant un autre 
absolument indépendant du premier. 

Envisageons maintenant un autre cas limite lorsque l’état du 
système À détermine complètement l’état du système Ÿ et inverse- 
ment (systèmes équivalents). On a alors H (X) = H (Y): 


H(X|IY =H(Y]IX)=0 
et 
[veox=1x=1r=H(X)=H(T), (18.5.9) 
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donc on obtient le cas déjà envisagé {formule (148.5.2)] d'observation 
directe du système X (ou, ce qui est la même chose, du système équi- 
valent Ÿ). 

Considérons le cas où entre X et Ÿ il y a une relation bien déter- 
minée unilatérale : l’état d'un système détermine entièrement celui 
de l’autre mais non inversement. Nous convenons d'appeler « systè- 
me dépendant » celui des deux dont l’état est entièrement déterminé 
par l’état de l’autre. D'après l'état d'un système dépendant il est 
impossible de déterminer d’une manière univoque l’état de l’autre. 
Par exemple, si le système X est le texte complet d'une communica- 
tion littérale, et Y son texte abrégé par omission detoutesles voyel- 
les. en recevant € cit » on ne peut dire avec certitude, si c’est « ca- 
lot », ou « colite », ou « culte » ou même « acolyte ». 

Il est évident que l’entropie d’un système dépendant est inférieure 
à l’entropie du système auquel il est lié. 

Nous allons déterminer l'information mutuelle contenue dans les 
systèmes dont l’un dépend de l’autre maïs non inversement. 

Supposons que des deux systèmes X et Y c’est le système X qui 
soit dépendant. On a alors H(X|Y)—=0 et 


Ireex=H(X), (18.5.10) 


ce qui traduit le fait que l'information mutuelle totale contenue dans 
les systèmes dont l’un est un système dépendant est égale à l'entropie de 
ce dernier. 

Nous allons trouver l'expression de l'information Zy.,,x non pas 
en fonction de l’entropie conditionnelle mais directement en fonction 
de l’entropie H (X, Ÿ) du système composé et. des entropies H (X) 
et H (Y) de ses composantes. 

En utilisant le théorème de l'entropie du système composé on 
obtient : 


H(XI|Y)=H{(X, Ÿ) — H(Y). (18.5.11) 


Le report de cette expression dans la formule (18.5.5) donne: 
Iyesx=H(X)+H(Y)—-H(X, Y), (18.5.12) 


donc l'information totale mutuelle contenue dans deux systèmes est 
égale à la somme des entropies des composantes moins l'entropie du systè- 
me composé. 

Les relations obtenues permettent facilement de trouver l’expres- 
sion générale de l'information mutuelle totale sous la forme d’une 
espérance mathématique. En substituant dans (18.5.12) les expres- 
sions 

H (X) = MI-log P (X)}, H (7) = M I-log P (Y)), 
H (X, Y) = MI-—log P (X, Y)l, 
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on obtient : 


Iyex=MI—1log P(X)—log P(Y)+log P(X, Ÿ)] 
ou 


P(X, Y) 


r 
Ty ,.x = M [log P(X) P(Y) (18.5.13) 


Pour le calcul direct de l’infcrmation totale mutuelle on écrit 
la formule (18.5.13) comme suit : 


1 


ne 
Irx=  Ÿ P; log il | (18.5.14) 
i=1j=i 


Pi = P((X = x) (Y = yj)): 
pi = P(X = x); r=P(Y = y) 
Exemple 1. Trouver l'information totale mutuelle contenue dans les 


systèmes X et Ÿ dans les conditions de l'exemple 1 du 8 18.4. 


Solution. A partir des données de l'exemple cité et de la table 7 de 
l'annexe on obtient: 


H(X,Y)= 2,25: H(X)—16; H(Y) = 1,57; 
Tyo,x = H(X)+H(Y)—H(X, Y) = 0,48 bit. 
Exemple 2. Un système physique X peut se trouver dans l’un des 


quatre états r1, z2, r3, x, les probabilités correspondantes sont données dans 
le tableau : 


T3 Ts 


pi | 0,1 | 0,2 | 0,4 | 0,3 


Les états r; ct x. sont indiscernables de même que les états r, et r,. La commu- 
nication concernant le système X indique que ce dernier se trouve dans l’un 
des états z:1, r° ou bien dans l’un des états z;, z;. On reçoit une communication 
respective. Déterminer l'information contenue dans cette communication. 
Solution. Dans l'exemple envisagé on étudie non pas le système X, 
nais le système dépendant Ÿ, se trouvant dans l’état y, lorsque X est dans l’un 
des états r1, x: et dans l’état y, lorsque X est dans l’un des états z:, z4. On a: 


rs —= P(Y = y) = 0,1 + 0,2 = 0,3; 
Fo —= P (Y — y2) = 0,3 + 0,4 = 0,7. 


L'information mutuelle, c'est-à-dire l’entropie du système dépendant 
sera : 


Iyox = — rs logr; —r2logr: = 1n(0,3)+n(0,7) = 0,88 bit. 
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18.6. Information partielle sur un système contenue 
dans une communication sur un événement. 
Information partielle sur un événement contenue 
dans une communication sur un autre événement 


Dans le paragraphe précédent nous avons étudié l'information 
totale (ou moyenne) sur un système X contenue dans une communi- 
cation nous informant de l’état du système Y. Dans certains cas il 
y a intérêt d'estimer l'information partielle sur le système X conte- 
nue dans une communication selon laquelle le système Y se trouve 
dans un état y;. Désignons cette information partielle par J,..x. 


Remarquons que l'information totale (ou moyenne) 7y.,x doit être 
l'espérance mathématique de l'information partielle pour tous les 
états possibles qui peuvent être objet d'une communication: 


m 


Ty_,.x = à rjly;ex. (18.6.1) 
= 


Nous allons écrire la formule (18.5.14) de Zy.,x (ou de /y._,x) d'une 
manière analogue à (18.6.1): 


m mm 


Iy-x= ÙY ÿ Pi; _S S r;P (mil y) X 


i1= 1 2—=1 i=1 j=1 


m ñn 

P P (x; 

x log EL = r Z P (ail y) log EH , (18.6.2) 
j=1 — 


ce qui permet d'obtenir par comparaison avec (18.6.1) l'expression 
de l'information partielle : 


P 
Iyex= S P (til y) log Ets) a D), (18.6.3) 


ii 


Prenons l'expression (18.6.3) pour définition de l'information 
partielle. En l’analysant nous voyons que ce n’est rien d'autre que 
la valeur moyenne de la grandeur 


log Et), (18.6.4). 
Pi 
prise sur tous les états z;, pondérée par les probabilités des valeurs x... 
T2, - + + Zn. Comme le système Y se trouve déjà dans l'état y,, 
en prenant la moyenne des grandeurs (18.6.4) on les multiplie non 
pas par les probabilités p; des états z;, mais par les probabilités 
conditionnelles P (zx; | y;). 
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Ainsi l'expression de l'information partielle peut s’écrire comme 
une espérance mathématique : 


_ P(X y) 
Ly,-x=M,, [og TP). ‘ 
(18.6.5) 
Montrons que l'information 
partielle J,.,x, tout comme 


l'information totale, ne peut être 
négative. À cet effet introduisons 
la désignation : 


P (zi] ys) _ 
Pi = Qi} (18.6.6) 


et considérons l'expression : 
P ES yJ)' 


Fig. 18.6.1 log = log qij. 


11 est facile de voir (fig. 18.6.1) que pour tout x >> 0 on a: 
Inz<z—'i. (18.6.7) 


Posant dans (18.6.7) x — on a : 


ne 1 
—hquy<-—1 mqgy>1i— : 
d'où: 


1 1 
log Qi} — Pa > In2 (1 — ——) . (18.6.8) 


En vertu de (18.6.2) ct (18.6.6) on a: 


7 n 
L 1 
1=1 i= 


É P 
2 à P(ilys) [1— ré ]= 
mi 


- TE {x P(&y)— 2 pi}. 
i=1 1= 1 


Let d 


Mais comme 


M3 


P(æluy= Pi=1, 


1 {= 1 


1- 


l'expression dans l'accols:le +st nulle; par conséquent Jr > 0. 
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Nous avons ainsi démontré que l'information partielle sur le syste- 
me X, contenue dans une communication relative à un état quelconque 
y; du système Ÿ ne peut être négative. Par conséquent l'information 
mutuelle totale Zy._,x n’est non plus négative (étant l'espérance ma- 
thématique d’une variable aléatoire non négative): 


Iys.x>0. (18.6.9) 


En vertu de la formule (18.5.5) donnant l'information Jy._,x= 
= H(X) — H(X|Y) on a: 
H(X)—-H(X|Y) >0 (18.6.10) 
ou 
H(XIY) < A (X), 


ce qui traduit le fait que l'entropie conditionnelle totale d'un système 
n'est pas supérieure à son entropie inconditionnelle *). 

Nous avons ainsi démontré l’assertion adoptée sans démonstra- 
tion dans le $ 18.3. 

Pour le calcul direct de l'information partielle, transformons quel- 
que peu la formule (18.6.3), en y introduisant au lieu des probabilités 
conditionnelles P (z;1y;) des probabilités inconditionnelles. En 
effet : 


P Gly) =" 
et la formule (18.6.3) devient : 


n 


Pi] Pi 
=D LL log Eu. (18.6.11) 


Exemple 1. Le système (X, Ÿ) est donné par le tableau des probabi- 
lités P;j: 


Pi 
J 


Trouver l'information partielle sur le système X contenue dans la communi- 
cation Ÿ — ya. 


*) Remarquons que ceci n'est vrai que pour l'entropie conditionnelle 
totale; pour ce qui est de l'entropie conditionnelle partielle H(X | y;) pour 
différents y, elle peut être supérieure qu'inférieure à H(X). 
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Solution. En vertu de la formule  . 


0,1 0,1 0,2 
Ty x= 73 18 5205 03/8 0,6-0,3 : 


La table 6 de l’annexe donne: 


log ES g = ]og 10 — log 12 = —0,263; 
log M2 108 20— 108 18 = 0,152 ; 
0,6-0,3 
lys x = —0,333-0,263+0,667-0,152 & 0,013 bit. 


Nous avons trouvé l'information partielle sur le système X 
contenue dans la communication particulière sur l'événement Ÿ = y}. 
Il est naturel de se demander est-ce que l’on peut aller plus loin et 
déterminer l'information partielle sur l'événement À — zx, sachant 
que Ÿ — y? Il se trouve que ce soit possible, seulement l’informa- 
tion ainsi obtenue « d’un événement à l’autre » aura des particulari- 
tés inattendues : elle peut être tant positive que négative. 

Partant de la structure de la formule (18.6.3) on peut trouver 
l'information « d'un événement à l’autre » comme suit: 


P 
l, log El, (18.6.12) 


donc l'information partielle sur un événement puisée dans une commu- 
nication concernant l'autre événement, est égale au logarithme du rap- 
port de la probabilité du premier événement après la réception de la com- 
munication sur le second à la probabilité a priori de ce même événement. 

En vertu de la formule (18.6.12) si la probabilité de l'événement 
À = z;, augmente après la réception de la communication Ÿ — y;, 
c'est-à-dire si 


P (zi | yj) > Pi 


l'information / y x est positive ; dans le cas contraire elle est néga- 


tive. En particulier, lorsque la réalisation de l’événement Y — ÿ) 
exclut complètement l'éventualité de l'événement X = x; (c'est-à- 
dire lorsque ces événements sont incompatibles), on a: 


L'information 7,,.., peut s'écrire comme suit: 


E E Lun Pi, 
Par ? 


ce qui montre qu'il y a Pr entre zx; et y, et donc: 


Typsz, = 108 = log “4 (18.6.13) 


Type, = Try, = V—x;* (18.6.14) 
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Nous avons ainsi introduit trois formes d'information : 
1) l'information totale sur le système X contenue dans le système 


Ty.,x = Iy—,x; 


2) l'information partielle sur le système X contenue dans l’évé- 
nement (communication) Ÿ — y;: 


3) l'information partielle sur l’événement X — x; contenue dans 
l'événement (communication) Y — y;: 


Loges Loges 


Les deux premières formes d’information ne sont pas négatives : 
la dernière peut être tant positive que négative. 


Exem P le 2. Une urne contient 3 boules blanches et 4 noires. Quatre 
boules ont été tisées de l’urne, trois noires et une blanche. Déterminer l’infor- 
mation contenue dans l'événement observé B sur l'événement À que le tirage 
suivant dans l’urne amènera une boule noire. 

Solution. Ona: 


Tp_ A =108 = le & 0,779 bit. 


18.7. Entropie et information des systèmes continus 


Jusqu’à présent nous avons envisagé des systèmes physiques dont 
les différents états x, z2, . . ., x, étaient dénombrables ; les proba- 
bilités de ces états étaient des grandeurs différentes de zéro p:, 
P2, + - «+» Pn-. Ces systèmes sont analogues à des variables aléatoires 
discontinues (discrètes) prenant les valeurs z,, x», . .., x, avec les 
probabilités p1, p2, - .., Ph. Dans la pratique on rencontre sou- 
vent des systèmes physiques d’un type différent, analogues à des 
variables aléatoires continues. Les états de ces systèmes ne peuvent 
être numérotés : ils se transforment les uns en les autres d’une manière 
continue, chacun d'eux ayant une probabilité égale à zéro, la répar- 
tition des probabilités étant caractérisée par une certaine densité. 
Par analogie avec les variables aléatoires continues nous appellerons 
ces systèmes « continus », à la différence de ceux étudiés précédem- 
ment que nous appellerons « discrets ». Le système continu le plus 
simple est celui dont l’état est décrit par une variable aléatoire con- 
tinue X de densité de probabilité f (x). Dans des cas plus compliqués 
l'état du système est décrit par plusieurs variables aléatoires X;, 
X2, -.., À, de densité de probabilité f (z1, z2, . .., x,). On peut 
alors le considérer comme la réunion (X:, X2, ..., X,) de systè- 
mes simples X1, X2, ..., À. 
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Soit un système simple X déterminé par une variable aléatoire 
continue À de densité de probabilité f (x) (fig. 18.7.1). Essayons 
d'étendre à ce système la notion d'entropie introduite au $ 18.1. 


. Fig. 18.7.1 Fig. 18.7.2 


Il y a lieu avant tout de noter que la notion de « système continu »s, 
tout comme celle de « variable aléatoire continue », est une certaine 
idéalisation. Par exemple, lorsque nous considérons la variable X, 
par exemple, la taille d’un homme, choisi au hasard, comme une 
variable aléatoire continue, nous faisons abstraction du fait qu'en 
réalité personne ne mesure la taille avec une précision meilleure que 
1 cm, et qu'il est impossibleen pratique de distinguer entre elles deux 
tailles différant de 1 mm par exemple. Néanmoins on peut décrire 
cette variable aléatoire comme une variable discrète, en supposant 
indiscernables les valeurs différant entre elles de moins de 1 cm. 

D'une manière analogue on peut, ayant établi la précision limite 
des mesures, c'est-à-dire ayant choisi un certain segment Ax à 
l'intérieur duquel les états du système X sont pratiquement indis- 
cernables, réduire le système continu à un système discret. Ceci 
équivaut à remplacer la courbe continue f (x) par une courbe en esca- 
lier, du type de l’histogramme (fig. 18.7.2); ici chaque segment 
de longueur Azx se trouve remplacé par un point représentatif. Les 
aires f (x;) Az des rectangles représentent les probabilités de tomber 
sur les segments correspondants. Si l’on considère comme indiscerna- 
bles des états du système associés à un même segment et que l’on les 
fait représenter par un même état, on peut approximativement déter- 
miner l'entropie du système X à Az près, on a: 


Hz (À) = — 2 f (zi) Az log {f (x1) Az} = 
= 2 f(x) Az {log f (x1) + log Ar} — 
= — D {f(zi)logf(r:)} Ar—log Az Sf(x) Az. (18.7.1) 
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Pour Az suffisamment petit on a: 


DU) lof (s)}ar& | f(2)log f(x) d7, 
L' -œ 


D'fi)Azz | f(x) dr=1 
| —®æ 
et la formule (18.7.1) devient alors: 
Ha (X)= — { f(x) log f (x) dx — log Az. (18.7.2). 


Notons que dans l’expression (18.7.2) le premier terme ne dépend 
pas de Ax, qui est la précision avec laquelle on détermine l’état du 
système. Seul le second terme (—log Az) en dépend, tendant vers 
l'infini pour Az —+ 0. C'est tout naturel, car plus on veut de préci- 
sion dans la détermination de l’état du système X, plus est l'incerti- 
tude qu'il faut lever et lorsque Az diminue indéfiniment cette incer- 
titude croît dans la même raison. 

Ainsi, si l’on se donne une zone Az aussi petite que l’on veut « d’in- 
sensibilité » des instruments de mesure servant à déterminer l’état 
du système physique X, on peut trouver l’entropie HA, (X) par la 
formule (18.7.2) dans laquelle le second terme croît indéfiniment 
lorsque Az —+> 0. Entre l’entropie H,. (À) et ce terme croissant indé- 
finiment il y a une différence qui se mesure par la grandeur indépen- 
dante de Az: 


H°(X)= — | f(x) log f (x) dr. (18.7.3) 


Cette grandeur peut être appelée entropie réduite du système continu 
X. L'entropie HA, (X) s'exprime en fonction de l'entropie réduite 
par la formule: 


Hz (X)= H° (X)— log Az. (18.7.4) 


On peut interpréter la relation (18.7.4) comme suit : seule l'origine 
des calculs de l’entropie dépend de la précision de mesure. 

Dans la suite pour simplifier l'écriture nous omettrons l'indice 
Az dans la notation de l’entropie et écrivons simplement H (X): 
la présence de Az dans le second membre indiquera toujours la pré- 
cision de mesure. 

La formule de l’entropie (18.7.2) admet une écriture plus simple 
si l’on la représente tout comme dans le cas des variables continues. 
comme l'espérance mathématique d’une fonction. Ecrivons tout 
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A'abord (18.7.2) comme suit: 
H(X)= — | f (x) log [/ (x) Az] dr. (18.7.5) 


Ce n'est rien d'autre que l’espérance mathématique de la fonction 
— log {f (x) Az} ce la variable aléatoire X de densité f (x): 


H (X) = M (—log {f (X) Azx)}]. (18.7.6) 
On peut écrire H* (X) d’une manière analogue, soit: 
H* (X) = M [—log } (X)1. (18.7.7) 


Passons maintenant au calcul de l’entropie conditionnelle. Soient 
deux systèmes continus XÀ et Ÿ. Dans le cas général ces systèmes 
sont liés. Désignons par f (x, y) la densité de probabilité des états 
du système composé (X, YŸ); f1 (x) la densité de probabilité du systè- 
me ZX; f2 (y) la densité de probabilité du système Y ; f (y| zx) et 
f(x y) les densités de probabilité conditionnelles. 

Avant tout nous allons déterminer l'entropie condition- 
nelle partielle AH(Y|zx), c'est-à-dire l’entropie du 
système Ÿ sachant que le système X se trouve dans l’état x. La for- 
mule sera analogue à (18.4.2) mais les probabilités conditionnelles 
P (yjlz:) seront remplacées par les lois de répartition conditionnel- 
les f (y | zx) et on verra apparaître le terme log Ay: 


H(YIz)=— À f(ylz)logf(y|z)dy—logAy.  (18.7.8) 


Passons maintenant au calcul de l’entropie totale (moyenne) 
conditionnelle Æ (Y | À) ; à cet effet il y a lieu de prendre la moyenne 
de l’entropie conditionnelle partielle H (Y | x) sur tous les états zx, 
compte tenu de leurs probabilités caractérisées par la densité fi (x) : 


H(Y1X)= — Î Ÿ (2) 12) og (y 2) de dy — log Av. (48.7.9) 


ou compte tenu de 


Î (x, y) = fi (x) f (y 2), 
H(Y|X)= — | Î f(x, v)logf(ylr)drdy—logAy.  (18.7.10) 


Cette formule peut s’écrire autrement : 
H(Y|X) = M[Î-—-log f (Y | X)]— log Ay (18.7.11) 


H(Y IX) = M [—log {f (Y | X) Ay}l. (18.7.12) 


ou 
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Ayant ainsi déterminé l’entropie conditionnelle nous allons mon- 
trer comment on peut l'utiliser pour trouver l’entropie d’un système 
com posé. 

Calculons tout d'abord directement l’entropie du système com- 
posé. Si les zones d'’insensibilité des systèmes X et Ÿ sont Ar et Ay, 
pour le système composé (X, Ÿ) ce sera le rectangle élémentaire 
AxAy. On aura pour l’entropie du système (X, Y): 


H(X, Y)=Ml—log {f(X, Y) AxAy}l.  (18.7.13) 
Î (x, y) = fi: (x) f (y1 zx), 


Comme 


on a: 
FAX, Y) = fi (X)f(Y X). (18.7.14) 
En substituant (18.7.14) dans (18.7.13) on a: 
H(X,Y) = M [—log f, (X) — log f (Y | À) — log Ar — log Ayl=— 
= À/ [—log (f1 (X) Ax)l + M [—log (f (Y | X) Ay)l, 
ou, compte tenu des formules (18.7.6) et (18.7.12), 
H(X,Y)=H(X)+H(Y]IX), (18.7.15) 


autrement dit le théorème sur l'entropie d’un système composé est 
applicable dans le cas des systèmes continus. 


Si X et Y sont indépendants l'entropie du système composé est 
égale à la somme des entropies des composantes : 


H(X,Y)=H(X) + H (M). (18.7.16) 


Exempl 1. Trouver l’entropie du système continu X dont les états 
sur un certain intervalle (x, B) sont équiprobables: 


1 
CLS pour a <z<$, 


0 pour z <a ou r > f. 
Solution. 


me | pi — VE dr =log(B—«); 


I (X) = log (B — «) — log Az 
ou 


H (X)= log De (18.7.17) 


Exemple 2. Trouver l'entropie du système X dont es états sont ré 
partis Sivant la lo normale: 


x2 
1 T 202 
f(z)=——— 2e 
31 2823 V2ro 
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Solution. 


H*(X)=M[— log { (X)1=M [ — 10 (ie) ]= 


2 — 
= M [iog( V2 6) +53 log e |=1o8 (VA 0)+ AE 1oge. 
Comme: 
M IX3] = DIX] = où, 
on a: 


H* (X)= log (V/2x 6)+ + log e log (V2x e0) 


et 
I (X) log (V2%e0)— log Az = log [ES] (18.7.18) 


Exemple 3. La position d'un avion est caractérisée par trois variables 
aléatoires: la hauteur Æ, le module de la vitesse V et l'angle 6 déterminant 
la direction du vol. La hauteur de l'avion est uniformément répartie sur l’inter- 
valle (k1, h2); la vitesse V suit une loi normale d'espérance mathématique r, 
et d'écart quadratique moyen 02; l’angle 6 est uniformément réparti sur l’in- 
tervalle (0, x). Les variables F7, V, 6 sont indépendantes. Trouver l’'entropie 
du système composé. 

Solution. 

D'après la formule (18.7.17) de l'exemple 1 on a: 


H (H)= log UE , 


où Ak est la « zone d’insensibilité » dans la détermination de la hauteur. 
L'entropie d'une variable aléatoire ne dépendant pas de son espérance 
mathématique, pour déterminer l'entropie en V on peut se servir de la formu- 


le (18.7.18): 
V'2x 


H (V)= log [SE] 


L'entropie du système par rapport à 6 est: 


H (8) = log (x —0) — log A6 — log 
Finalement on a: 
2—h: V/27 cos a 


h 


ou 


Ah PAG ° 5 : (18.7.19) 


H(H, V, 0)=log re Vancor, 7 
Notons que les facteurs dans l'accolade ont la même interprétation: ils 
indiquent combien de zones d’insensibilité se placent dans l'intervalle sur 
lequel est donnée la loi de répartition de la variable aléatoire respective. Dans 
le cas d’une loi uniforme c'est simplement l'intervalle des valeurs possibles 
de la variable aléatoire; dans le cas de la loi normale cet intervalle est égal 


à V2res où © est l'écart quadratique moyen. 


18.7] ENTROPIE ET INFORMATION DES SYSTÈMES CONTINUS 483 


Nous avons ainsi généralisé la notion d’entropie au cas des systè- 
mes continus. On peut d’une manière analogue généraliser la notion 
d'information. L’incertitude liée à la présence dans l'expression de 
l'entropie d'un terme augmentant indéfiniment disparaît: lorsque 
l'information est calculée comme une différence de deux entropies, 
ces termes se compensent. C’est pourquoi toute sorte d'information 
se rapportant à des grandeurs continues ne dépend pas de la « zone 
d’insensibilité ».. 

L'expression de l'information totale mutuelle contenue dans deux 
systèmes continus X et Ÿ sera analogue à (18.5.4) avec cette seule 
différence que les probabilités sont remplacées par les lois de réparti- 
tion et les sommes par des intégrales : 


". en 
Re J] FC pos dr dy (18.7.20) 


ou, en introduisant le signe de l’espérance mathématique, 


: FX, M) 
Iyeex =M Lrrnes sn | - (18.7.21) 


L'information totale mutuelle Zy.,_,x, tout comme dans les systèmes 
discrets, est une grandeur non négative ne s’annulant que lorsque les 
systèmes X et Ÿ sont indépendants. 


Exemple 4. Sur le segment (0, 1) on marque d'une manière aléatoire 
deux points L’ et V indépendamment l'un de l’autre; chacun de ces points 
cst uniformément réparti sur cet intervalle. Dans une expérience l’un des points 


Y 
=—@.@’#pmm— DL 
PR ZI 1 


Fig. 18.7.3 


s'est trouvé à droite de l’autre. Quelle est la quantité d’information sur la 
position du point de droite que donne Ja connaissance de la position du point 
de gauche? 

Solution. Soient deux points aléatoires LU et l sur l'axe des ab cisses 
Oz (fig. 18.7.3). Désignons par Y l'abscisse du point de gauche, et par Xs celle 
du point de droite (sur la figure 18.7.3 c’est le point U qui s'est trouvé à gau- 
che, mais l'inverse aurait pu se produire). Les variables X et Y sont associées 
à U et V par les relations: 


Y= min {U,V}; X = max {l/, V}. 


Nous allons déterminer la loi de répartition du système (X, Y). Comme 
Y -< X cette loi n'existera que dans le domaine D hachuré sur la figure 18.7.4. 
Désignons pr f (x, y) la densité de probabilité du système (X, Y) et calculons 
l'élément de probabilité f (x, y) drdy, c’est-à-dire la probabilité pour le point 
aléatoire (X, Ÿ) de se trouver dans lv rectangle élémentaire (x, x + dr; y, 


31° 
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y + dy). Il y a deux éventualités possibles pour cet événement : c’est le point 
U qui se trouvera à gauche et le point V à droite ou bien l'inverse. Par consé- 
quent : 


------------ À f(x, y)dxdy = (x, y) dzdy+-q(y, x)dzdy, 


où œ (u, v) est la densité de probabi- 
lité eu système de variables (U, V). 
ci 


u 0<u<i 
plu, v)=1 ee à) 


par conséquent: 
P(z, y) = p(y, x) = 1; 
Î (zx, y) drdy = 2 drdy 
ZT et 


RKK 
: ZI dr 
2 pour (r,y) CD, 
0 pour (x, y)d= D. 
Cherchons maintenant les lois de répartition des grandeurs composant 

le système, on a: 


Fig. 18.7.4 f (2 y) = 


œ x 
fa (x) = | f(x, dy= | 2ay=2 pour 0O<zr<1; 
— 00 0 


d'une manière analogue: 


O0 


Î 
fa (x) = | [(&, pds= | 24e =2(1—y pour 0<y<1. 
[4 


—œo 


Les graphiques des densités f1 (x) et fe (y) sont représentés sur la figure 18.7.5. 


En portant f(x. y), f; (x) et f2 (y) dans la formule (18.7.20) on obtient: 
1 1 
PP see ————…—…———…—…—— fx dy = 
ox =TS fins 2 dx dy 
(D) 


me {—in2+ [1 2(— In z) dz dy + [1 2[—In(1 - y) de dy . 
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Vu la symétrie du problème, les deux dernières intégrales doubles sont égales 
entre elles et 


4 
Lyeox= 155 | | In x dz dy = 
(D) 
1 


1 x 
4 2 1 
Ai | In x dr | dy=—i—xs | 2zinzdz=;—1% 0,44 bit. 
V U) U 


Exemple 5. Soit une variable aléatoire normale X, de paramètres 
m, = 0 et 6. L erreur de mesure de X est égale à Z, cette dernière suit égale- 
ment une loi normale de paramètres m, = 0, ©. L erreur Z ne dépend pas 
de X. On dispose du résultat de mesure 


Y=x+2 


qui est également une variable aléatoire. Déterminer la quantité d’infor- 
mation sur X contenue dans Ÿ 


Solution. Utilisons pour calculer l'information la formule (18.7.21), 
c'est-à-dire cherchons l'information comme l'espérance mathématique de la 
variable aléatoire 

f(X, Y) 
U=log <> . 18.7.22 
6 7 (0) fa D Mi 


Faisons tout d’abord la transformation suivante: 
f(x, y) _, fit) f(y|z) | f(y 1x) 
LB Tr) fa EE Ga) EU 


Dans notre cas 
va 
1 2 (0x+02) 
bLb(y)=— nr — 0 PEN 
POV Var 
_W-x? 
1 202 


e 
V' 27 oz 


L'expression (18.7.22) vaut: 


Voitoi, 1 F(Y—XY Y2 


(voir chapitre 9). 


Fy1z)= 


Uno +3 55 20:40] 
os VE, 1 [2 
Fe Oz In 2 L 20? ee l' 


d'où 


Voi+oi, 1 CMIZA  M[Y2 : 
LES + | |. (18.7.23) 


Re TZ 2CE+0) 


Mais m,— my — 0, par conséquent: 


M1[Z227]=D(Z]= 0, | 


‘7. 
M[Y2]=D[Y]=0+0o%. he 
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En substituant (18.7.24) dans (18.7.23) on obtient: 


ni La 
Ty-.,.x = log Voitoi bits *). 
z 


Par exemple, pour 6, = 6,: 


Si 0, = 4; 6, = 3,0ona Tyaex = log à & 0,74 bit. 


18.8. Problèmes du codage des communications. 
Code de Shannon-Fano 


Lorsqu'on transmet une communication on est toujours obligé 
à utiliser un code quelconque, c’est-à-dire à représenter les messages 
sous la forme d’une suite de signaux. Citons en exemple l'alphabet 
Morse adopté en télégraphie pour la transmission des communica- 
tions verbales. Avec ce code on représente une communication quel- 
conque sous la forme d’une combinaison de signaux élémentaires : 
point, trait, pause (espace entre lettres), pause longue (espace entre 
mots). 

En général, on appelle codage la représentation de l'état d’un systè- 
me physique à l’aide de l’état d’un autre système. Par exemple, dans 
une conversation téléphonique les signaux sonores sont codés sous 
la forme d'oscillations électromagnétiques, puis décodés, redevenant 
des signaux sonores à l’autre extrémité de la ligne. Dans le cas le plus 
simple de codage, les deux systèmes X et Ÿ (à représenter et repré- 
sentant) ont un nombre fini d'états possibles. Il en ait ainsi dans le 
cas des communications littérales, par exemple, en télégraphie. Nous 
allons nous limiter à ce cas simple de codage. 

Soit un certain système X (par exemple les lettres de l’alphabet) 
pouvant prendre d’une manière aléatoire l’un des états z,, 272, ..., Zn. 
Nous voulons le coder à l’aide d’un autre système Y, dont les états 
possibles sont y, Y2, - . ., Ym- Si M LR on n'arrive pas à mettre 
en correspondance à chaque état du système X un état du système Ÿ. 
On est obligé alors à représenter un état du système X par une certai- 
ne combinaison (suite) d'états du système Y. Ainsi dans l'alphabet 
Morse les lettres sont représentées par différentes combinaisons de 
symboles élémentaires (point, trait). Le choix de ces combinaisons et 
l'établissement d’une correspondance entre les communications à 
transmettre et ces combinaisons constitue codage le au sens strict du 
mot. 

Les codes se distinguent les uns des autres par le nombre de sym- 
boles élémentaires servant à former une combinaison, en d’autres 


*) On aurait pu aboutir au même résultat en utilisant la formule (18.7.20) 
mais par une méthode plus compliquée. 
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termes par le nombre d'états possibles du système Y’. Dans l'alpha- 
bet Morse il y a quatre symboles élémentaire: (point, trail, pause 
courte et pause longue). La transmission des signaux peut être réa- 
lisée sous différentes formes : signaux lumineux, émission de courant 
électrique de durées différentes, signaux sonores, etc.). Un code à 
deux symboles élémentaires (0 et 1) est appelé binaire. Les codes 
binaires sont beaucoup utilisés dans la pratique, surtout pour l’in- 
troduction de l'information dans les calculatrices électroniques 
fonctionnant en système binaire. 

Une même communication peut Ctre codée de différentes maniè- 
res. Il se pose alors le problème du codage optimal. I] semble naturel 
de considérer comme optimal un code assurant la durée minimale 
de transmission. Si la transmission d’un symbole élémentaire (par 
exemple 0 ou 1) prend le même temps, le code optimal sera celui pour 
lequel la transmission d’une communication nécessitera un nombre 
minimal de symboles élémentaires. 

Supposons qu'il y ait lieu de représenter en code binaire les lettres 
de l'alphabet français de telle sorte qu’à chaque lettre corresponde 
une certaine combinaison des symboles élémentaires 0 et 1 et que le 
nombre moyen de ces symboles par lettre du texte soil minimal. 

Soit les 26 lettres de l'alphabet français : a, b,c,d,e,f,g,h, i, 
j,k,l,m,n,o,p,q,r,s,t,u, v, w, x, y, z, plus l'intervalle entre 
les mots que nous désignerons par « — » et l’apostrophe « ‘ » (un seul 
symbole) ainsi que les lettres é, è, à, à. (au total 31 lettres). 

La première idée est d'attribuer aux lettres, sans en changer l'or- 
dre, un numéro de 0 à 30, puis de transformer cette numération cn sys- 
tème binaire. Rappelons que dans le système binaire les unités des 
différents rangs sont des puissances de deux. Par exemple, le nombre 
décimal 12 peut ètre représenté comme 


12 = 1.23% + 1-24 0.21 + 0.29 


et donc sa forme binaire sera 1100. 
Le nombre décimal 25 


25 = 1-24 + 1-25 + 0.2 + 0.21 + 4.20 


s’écrira en système binaire comme 11001. 
Chacun des nombres 0, 1, 2, ..., 30 peut être représenté par un 
nombre binaire à cinq chiffres. On obtient alors le code suivant : 


a æ 00000 
b — 00001 
c — 00010 
d — 00011 
z = 11001 
« — » = 11010 
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e — 11011 
è — 11100 
à — 11101 
ù — 11110 


Dans ce code il faut exactement cinq chiffres élémentaires pour 
représenter une lettre. La question qui se pose est de savoir si ce code 
est optimal et n'est-il pas possible de trouver un autre code dans lequel 
pour une lettre il faudra en moyenne moins de symboles élémentaires ? 

En effet, dans notre code pour représenter une lettre, que ce soit 
les lettres « a », « e », « o » que l’on rencontre fréquemment, ou les 
lettres « v », « w », « X », « y », « z » rares, il faut un même nombre 
de symboles. Il est clair qu'il serait plus raisonnable d'utiliser pour 
les lettres fréquentes moins de symboles que pour les lettres rares. 

Pour pouvoir établir un tel code il faut évidemment connaître 
la fréquence d'emploi des lettres de l’alphabet français. On peut trou- 
ver ces fréquences dans le tableau 18.8.1 où les lettres sont disposées 
par ordre décroissant des fréquences. 


Tableau 18.8.1 


Lettre re | Lettre ne | Lettre à | Lettre | 4 Fr 

«—» 0,164 f 0,010 0,051 à 0,002 
8 0,145 v 0,009 O0 0,043 x 0,0004 
a 0,081 b 0,009 s 0,038 z 0,0002 
0077 q 0 :008 p 0.028 y | 0.000! 
n 0,063 b 0,007 d 0,02S ü 0,0001 
t 0,063 è 0,005 c 0,023 w 0,0001 
r 0,053 0,005 | m | 0,017 k | 0,000: 
u 0,053 ] 0,005 6 0,012 


En utilisant ce tableau on peut établir le code le plus économique 
basé sur la quantité d'information. [1 est évident que le code sera le 
plus économique lorsque chaque symbole élémentaire transmettra 
le maximum d'information. Considérons un symbole élémentaire 
(donc le signal le représentant) comme un système physique à deux 
états possibles : 0 et 1. 

L'information associée à ce symbole est égale à l’entropie du sys- 
tème et est maximale dans le cas oùses deux états sont équiprobables ; 
le symbole élémentaire transmet alors une information qui vaut 
1 bit. C’est pourquoi on met à la base du codage optimal la condition 
que les symboles élémentaires dans un texte codé soient en moyenne 
également fréquents. 

Nous allons exposer ici une méthode de construction d'un code 
satisfaisant à cette condition ; cette méthode est connue sous le nom 
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de « code de Shannon-r'ano ». Les symboles codés (lettres et combinai- 
sons de lettres) sont répartis en deux groupes à peu près équiprobables : 
dans le premier groupe de symboles à la première place des combinai- 
sons de code on met 0 (premier chiffre d’un nombre binaire repré- 
sentant le symbole) ; dans le second groupe le nombre binaire com- 
mence par 4. Puis chaque groupe est de nouveau divisé en deux sous- 
groupes à peu près équiprobables ; pour les symboles du premier sous- 
groupe on met le zéro à la seconde place; dans le second sous-groupe, 
l'unité, etc. 

Nous allons illustrer l'emploi du code de Shannon-Fano sur l'exem- 
ple de l’alphabet français (tablezu 18.8.1). Faisons la somme des pro- 
babilités (fréquences) des quatre premiers éléments du tableau, on 
obtient 0,467. La probabilité correspondant à toutes les autres lettres 
de«n»àäs«k»est à peu près la même, soit 0,533. Les quatre premiè- 
res lettres auront à la première place du code le signe binaire 0, les 
autres lettres, l’unité. Puis on divise de nouveau le premier groupe en 
deux sous-groupes à peu près équiprobables : de « — » à «e » et de 
«a»àäsi»; pour toutes les lettres du premier sous-groupe on mettra 
zéro à la seconde place, et pour celles du second sous-groupe, l’unite. 
On continue ainsi jusqu’à ce que dans chaque groupe il ne reste qu'une 
seule lettre qui sera codée par un certain nombre binaire. Le tableau 
18.8.2 permet de comprendre le principe de formation du code, le 
code lui-même est donné par le tableau 18.8.3. 

En se servant du tableau 18.8.3 on peut coder et décoder n’impor- 
te quelle communication. A titre d'exemple écrivons en code binaire 
la phrase: « théorie de l'information » 


10011111111001111100111001010001000111 100001000101 1000011100 
01111101011100101011110110101001011111001000 


Notons qu'ici on n’a pas besoin de séparer les lettres les unes des 
autres par un signe spécial car le décodage est univoque. On peut 
s'en rendre compte en décodant la phrase suivante à l’aide du ta- 
bleau 18.8.3: 


111101111100111100011000111100011000111101011100111100010 
111111110001 


(« mode de codage »). 

Il faut cependant noter que toute erreur de codage (confusion acci- 
dentelle des signes 0 et 1) est dans un tel code funeste car le décodage 
de toute la partie du texte suivant l’erreur devient impossible. C’est 
pourquoi ce principe de codage peut être recommandé seulement dans 
les cas où les erreurs de codage et de transmission de la communica- 
tion sont pratiquement exclues. 

On se pose alors la question de savoir si le code établi est, en l’ab- 
sence d'erreur, optimal. Pour répondre à cette question nous allons 
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trouver l'information moyenne rapportée à un symbole élémentaire 
(0 et 1) et la comparer à l'information maximale possible qui est égale 
à un bit. A cet effet trouvons tout d'abord l'information moyenne 
contenue dans une lettre H (1) du texte transmis, c'est-à-dire l’entro- 
pie d’une lettre: 


31 31 
H()=— 2 pilog pi= 2 n(p), 


P: étant la probabilité pour que la lettre prenne un certain etat 
(« — »,a,b,c, ..., z, 6, è, à, ù). 
À partir du tableau 18.8.1 on a: 


H (1) = n (0,164) + n (0,145) + . . . + n (0,0001) + 
+ n (0,0001) & 4,11 


bits par lettre du texte. 
A partir du tableau 18.8.2 on trouve le nombre moyen de symboles 
élémentaires par lettre: 


Pimoy — 3 «0,164 + 3 «0,145 + .. + 14 -0,0001 + 
+ 14-0,0001 = 4,14. 


En divisant l’entropie Æ (1) par moy on obtient l'information 
par symbole élémentaire : 
4,11 
"4,14 


Ainsi, l'information rapportée à un symbole est très voisine de 
sa limite supérieure 1, donc le code adopté est très proche du code 
optimal. Si on reste dans les limites du codage par lettres on ne peut 
obtenir rien de mieux. 

Notons que, dans le cas du codage binaire des numéros d'ordre 
des lettres, chaque lettre aurait été représentée par cinq symboles 
binaires et l’information par symbole serait : 


= 


= 0,993 bit. 


Ls=- 


13=- =0,822 bit, 
c'est-à-dire nettement inférieure à celle du codage littéral optimal. 

Il faut cependant noter que le codage littéral n’est pas en général 
économique. En effet, il y a toujours corrélation entre les lettres d’un 
texte sensé quelconque. Par exemple, en français, après un «q» 
il y a toujours un «su»; un mot ne peut commencer par un « ù », 
la combinaison « pb » est impossible, etc. 

Nous avons déjà vu que l’entropie d’un système composé est infc- 
rieure à la somme des entropies des composants ; par conséquent, l'in- 
formation transmise par un morceau de texte sensé est toujours infé- 
rieure à l'information portée par un symbole multipliée par le nombre 
de symboles. Compte tenu de ce qui vient d’être dit, on peut élaborer 
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un code plus économique en codant non pas chaque lettre séparément 
mais des blocs de lettres. Par exemple dans un texte français il y a 
lieu de coder certaines combinaisons de lettres que l’on rencontre 
fréquemment, par exemple « tion », « ure », « ment », etc. Les blocs 
codés sont disposés par ordre décroissant de fréquences comme les 
lettres du tableau 18.8.1, le codage binaire s'effectuant de la même 
manière 

Dans certains cas il est raisonnable de coder non pas des blocs 
de lettres, mais des parties de phrases sensées. Par exemple, pour allé- 


Canal 
Fig. 18.8.1 


ver le travail du télégraphe la veille des fêtes il est conseillé de coder 
par des numéros spéciaux des textes entiers comme: 

« Meilleurs vœux de nouvel an ». 

Sans nous arrêter spécialement sur les méthodes de codage par 
blocs nous nous limiterons à la formulation du théorème de Shannon. 

Soit une source d’information X et un récepteur Ÿ reliés entre 
eux par un canal de transmission C (fig. 18.8.1). 

Le débit H; (X) de la source d’information est donné. Par debit 
en entend la quantité moyenne d'information, en bits, provenant de 
la source par unité de temps (numériquement égale à l’entropie de 
la communication débitée par la source par unité de temps). Suppo- 
sons de plus que soit donnée la capacité C; du canal de transmission, 
c'est-à-dire la quantité maximale d'information (par exemple, de 
signes binaires O ou 1) que peut transmettre le canal en cette même 
unité de temps. Quelle doit être alors la capacité de transmission du 
canal pour qu'il puisse s’acquiter de sa tâche, donc transférer sans 
retard vers le récepteur Y l'information issue de la source X? 

Le premier théorème de Shannon donne une réponse à cette ques- 
tion. Nous nous limitons à formuler ce théorème, sans en donner la 
démonstration. 


Premier théorème de Shannon 
Si la capacité de transmission C, d'un canal est supérieure à l'entro- 
pie de la source d'information par unité de temps 


C1 > Hi (ZX) 


il est toujours possible de coder une communication suffisamment longue 
de telle sorte qu'elle soit transmise sans retard par le canal de transmis- 
sion. Si au contraire 

Ci < H,; (X), 


la transmission sans retard est impossible. 
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18.9. Transmission de l'information avec déformations. 
Capacité de transmission d'un canal 
avec bruits 


Dans le paragraphe précédent nous avons envisage les questions 
liées au codage et à la transmission de l'information par des canaux 
parfaits, lorsque la transmission de l'information se déroule sans 
erreurs. En fait les erreurs viennent toujours entacher l'information. 
Un canal de transmission où l'information subit des déformations est 
appelé canal avec bruits. Dans le cas particulier, où des erreurs appa- 
raissent lors du codage, le dispositif de codage peut être considéré 
comme un canal avec bruits. 

I1 est évident que les bruits entraînent une perte d'information. 
Pour parer à cet inconvénient il y a lieu de prendre des mesures spé- 
ciales. L’une des mesures est la redondance de l'information trans- 
mise. On y arrive en faisant débiter la source d'information beaucoup 
plus de symboles qu'iln'enfallaiten l'absence de bruits. La forme la 
plus simple d'introduction de redondance est la répétition du message. 
On utilise cette méthode si l’audibilité téléphonique est mauvaise. 
en répétant deux fois chaque message. Une autre méthode bien connue 
pour augmenter la fiabilité de la transmission est d'épeler le mot en 
transmettant au lieu de chaque lettre des mots bien connus (noms) 
commençant par cette lettre. 

Remarquons que toutes les langues vivantes ont une certaine 
redondance, qui d’ailleurs permet souvent de rétablir le texte exact 
d’après « le sens » de la communication. C'est pourquoi les erreurs 
commises dans un télégramme conduisent rarement à une perte d'in- 
formation : géneralement on arrive à les corriger en se guidant 
seulement des connaissances de la langue. Ceci aurait été impossible 
sans redondance d'information. Pour mesurer la redondance d’une 
langue on se sert de la grandeur 


TE (18.9.1) 
où 4 est l’entropie moyenne réelle, rapportée à un symbole trans- 
mis (à une lettre), calculée pour des morceaux de texte suffisamment 
longs, compte tenu de la corrélation entre les symboles ; nr le nombre 
de symboles utilisés (lettres) ; log r l’entropie maximale possible par 
symbole transmis, dans des conditions données, supposant que tous 
les symboles soient équiprobables et indépendants. 

Les calculs effectues pour les langues européennes les plus répan- 
dues montrent que leur redondance atteint 50 % et même plus, ceci 
signifie que, grossièrement, 50 % des symboles transmis sont super- 
flus ct auraient pu ne pas être trausmis, s'il n’y avait pas de danger 
de déformations. 

Cependant pour une transmission correcte de données la redondan- 
ce naturelle d’une langue peut se trouver être tant excessive qu'’insuf- 
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fisante : tout dépend du danger de déformations (« niveau de bruits ») 
du canal de transmission. 

Les méthodes de la théorie de l'information permettent de trouver 
pour un niveau de bruits donné la redondance exigée de la source 
d'information. Ces mêmes méthodes permettent d'élaborer des codes 
spéciaux antibruits (en particulier, les codes « autocorrecteurs »). 
Pour résoudre ces problèmes il faut savoir tenir compte de la perte 
d’information éventuelle dans un canal en présence de bruits. 


Canal 


me” 
Bruits 


Fig. 18.9.1 


Considérons un système composé, formé par une source d'’infor- 
mation X, un canal de transmission C et d’un récepteur Ÿ (fig. 18.9.1). 
La source d’information est un système physique X ayant n ctats 
possibles 


Ti, 2, + - +9 Tn 
de probabilités respectives 


Pis P2r Pn- 


Nous allons envisager ces états comme des symboles élémentaires 
que peut éventuellement transmettre la source X par le canal C au 
récepteur Ÿ. La quantité d’information par symbole fournie par la 
source sera égale à l'entropie par symbole : 


n 


H (4) = 2 Pi log p.. 


Si lors de la transmission l'information n'était pas entachée d'er- 
reurs, la quantité d’information contenue dans le système Ÿ sur X 
serait égale à l’entropie même du système X. En présence d'erreurs 
cette quantité sera plus petite, soit: 


[ye.x = H(X)— H(XÏY) 


Il est naturel de considérer l’entropie conditionnelle A (X | Y) 
comme perte d'information par symbole élémentaire, due à la pre- 
sence de bruits. 

Sachant évaluer la perte d’information par symbole élémentaire, 
on peut trouver la capacité de transmission d’un canal avec bruits, 
c'est-à-dire la quantité maximale d'information qu'il peut trans- 
mettre en unité de temps. 
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Supposons qu’un canal puisse transmettre À symboles par unité 
de temps. En l'absence de bruits la capacité de transmission du canal 
serait égale à : 


C=klog n, (18.9.2) 


car la quantité maximale d'information portée par un symbole vaut 
log n, donc celle portée par À symboles est égale à k log nr, ceci si les 
symboles sont indépendants les uns des autres. 
Considérons maintenant un canal avec bruits. Sa capacité de 
transmission est : 
C := k max UT Yo X: (18.9.3) 


où max Z(1, y..xest l'information maximale par symbole pouvant être 
transmise en présence de bruits. 

Il est en général difficile de déterminer cette information maxi- 
male car celle-ci dépend des déformations des symboles et des pro- 
babilités de ces déformations ; il importe de savoir si les symboles 
peuvent ètre confondus ou simplement perdus, si les déformations 
sont indépendantes ou liées, etc. 

Pourtant pour les cas simples il est relativement facile de calculer 
la capacité de transmission d'un canal. Soit un canal C transmettant 
d’une source d'information À à un récepteur Ÿ les symboles élé- 
mentaires 0 et 1, à raison de 4 symboles par unité de temps. Chaque 
symbole lors de la transmission peut être déformé (remplacé par son 
opposé) indépendamment des autres et ceci avec une probabilité 
égale à p. Il y a lieu de calculer la capacité de transmission du canal. 

Détcrminons tout d’abord l'information maximale par symbole, 
susceptible d'être transmise par le canal. Supposons que la source 
débite les symboles 0 et 1 avec les probabilités respectives p et 1 — p. 

L'entropie de la source est donc: 


H(X) = —p log p — (1 — p) log (1 — p). 
Cherchons l'information /(1,7.x par symbole élémentaire : 
Layex = H(Y)—H(YIX). 


Pour trouver l'entropie conditionnelle totale Z7 (Y | X) il faut 
avant tout trouver les entropies conditionnelles partielles : 4 (Y | X;) 
(entropie du système Ÿ à condition que le système X se trouve dans 
l'état r,) et H (Y]| zx2) (entropie du système Ÿ à condition que lo 
système X se trouve dans l’état x). Calculons Æ (Y | x;); pour cela 
supposons que cesoitlesymbole élémentaire O qui a été transmis. 
Nous allons trouver les probabilités conditionnelles pour le système Y 
de se trouver dans l’état y; = 0 et dans l’état y: — 1. La premiéie 
est égale à la probabilité de non-confusion du signal : 


P(ylz)=1—-u, 
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la seconde à la probabilité de confusion du signal : 
P (yzlx) = pu. 


L'entropie conditionnelle H (Y | x:) sera : 
H(Y |x) = à P (y: 123) log P (yil x) 


= —(1— 4) log (1—u)—u log . 


Calculons maintenant l’entropie conditionnelle du système Y pour 
la condition À — zx, (un signal « 1 » a été transmis) : 


P (yilz2) =; P (y21z2) = 1 — pu, 
d'où | 
H(Y |ze) = —p log u — (1 — y) log (1 — p). 
Ainsi 
H(Y x) = H(Y]\z:) = —p log u — 
— (4 — y) log (1 — p). (18.9.4) 


L'entropie conditionnelle Æ (Y | X) s'obtient en prenant la moyenne 
des entropies conditionnelles Æ (Y | x;) et H (Y | z:), compte tenu 
des probabilités p et 1 — p des états x; et x. Les entropies condition- 
nelles étant égales entre elles, on a: 


H(Y IX) = —plogu — (1 — u) log (1 — u). 


D'où la conclusion suivante: l’entropie conditionnelle H (Y | X) 

ne dépend point des probabilités p et 1 — p des symboles 0 et 1 dans la 

communication transmise mais seulement de la probabilité d'erreur hu. 
Nous allons calculer l'information totale par symbole: 


Layex=H(Y)-H(Y]|X)= 
={—rlogr—(1—7r) log (1—r)}—{—u log 1 —(1—u}log (1—u)} = 
={[n(r)+n(—r)]—{n(u) +n(1—mu)], 


où rest la probabilité d’avoir à la sortie le symbole 0. Il est évident 
que pour des performances données du canal, l'information par sym- 
bole Z1,y_.x est maximale quand n (r) + n (Î—r) est maximale. 
Cette fonction est maximale pour r — 1/2, c'est-à-dire IÎorsqu'à 
la réception les deux symboles sont équiprobables. Il est facile de 
voir que ceci correspond au cas où la source transmet les deux sym- 
boles avec la même probabilité p := 1/2. Pour cette même valeur 
p = 1/2 l'information par symbole est également maximale. La va- 
leur maximale est : 


Leny-x=H()—[n(u)+n(i—u)}= 1—In(u)+n(1—-n)]. 
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Par conséquent, dans notre cas 
max Jyy.x=1—[n(u) +n(1—u)], 

et la capacité de transmission du canal est égale à: 
C=k{{—{in(u) +n(i—u)j}. (18.9.5) 


Notons que n (u) + n (1 — u) n’est rien d’autre que l’entropie 
d'un système ayant deux états possibles avec les probabilités up et 
1 — u. Cette entropie caractérise la perte d’information par symbole 
liée à la présence de bruits dans le canal. 


Exemple 1. Déterminer la capacité de transmission d'un canal pou- 
vant transmettre 100 symboles 0 et 1 en unité de temps, chacun des symboles 
étant déformé (remplacé par son opposé) avec une probabilité égale à  — 0,04. 

Solution. Dans la table 7 de l'annexe on trouve: 


n (H) = 0,0664, 
n (1 — p) = 0,0144, 
n (4) + n (1 — u)= 0,0808. 
La perte d’information par symbole est égale à 0,0808 bit. La capacité de trans- 
mission cherchée du canal est: 
C = 100 (1 — 0,0808) = 91,92 = 92 bits en unité de temps. 


Des calculs analogues permettent de trouver la capacité de trans- 
mission d’un canal dans des cas plus compliqués, lorsque le nombre 
de symboles élémentaires est supérieur à deux et les déformations des 
differents symboles ne sont pas indépendantes. Connaissant la capa- 
cité de transmission d'un canal, on peut trouver la limite supérieure 
de la vitesse de transmission de l'information par un canal avec 
bruits. Nous allons formuler (sans démonstration) le second théorème 
de Shannon relatif à ce cas. 


Second théorème de Shannon 
Soient une source d'information X dont l’entropie en unité de temps 
est égale à H (X), et un canal de capacité de-transmission C. Si 
H(X)>C, 


quel que soit le codage il ne peut y avoir transmission sans retard ni défor- 
mations. Au contraire, si 


H (x <C, 


on peut toujours coder une communication suffisamment longue de telle 
sorte qu'elle soit transmise sans retard ni déformations avec une proba- 
bilité aussi voisine de l'unité que l'on veut. 


Exemple 2. Soient une source d’information d’entropie H Qu = 
= 100 bits en unité de temps et deux canaux de transmission de capacité 70 sym- 


32—2823 
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boles binaires {0 et 1) en unité de temps; chaque symbole binaire est remplacé 
par son upposé avec une probabilité égale à u = 0,1. Il faut déterminer si la 
capacité de transmission de ces canaux cst suffisante pour transmettre l’infor- 
mation débitéc par ja source. 

Solution. Cherchous la perte d'informatiou par symbole: 


nu)+n(i—n) = 0,332 + 0,137 -= 0,469 bit. 
La quantité maximale d’information transmise par un canal en unité de temps 
est : 
— 70 (4 — 0,469) — 37,2 bits. 


La quantité maximale d'information pouvant être transmise par les deux 
canaux en unité de temps vaut: 


37,2-2 = 74,4 bits. 


CHAPITRE 19 


ÉLÉMENTS DE LA THÉORIE 
DES PHÉNOMEÈNES D'ATTENTE 


19.1. Objet de la théoric des phénomènes d'attente 


Ces dernières décennies les problèmes particuliers, ceux des phé- 
nomènes d'attente, se posent dans les domaines d’activite les plus 
divers. À titre d'exemple on peut citer les stations téléphoniques, les 
ateliers de réparation, les guichets de billets, les agences de renscigne- 
ments, les coiffeurs, etc. La structure des phénomènes d'attente com- 
prend un certain nombre d'unités de service que nous appellerons 
canaux de service ou stations. Les canaux de service peuvent être des 
lignes de communication, des employés effectuant telle ou telle opé- 
ration, différents appareils, etc. Les systèmes d'attente peuvent être 
mono- ou multicanaux. 

Tout système d'attente doit répondre aux flux de demandes ou 
d'unités qu'il reçoit. Les demandes arrivent l’une après l’autre à 
des instants qui sont dans le cas général aléatoires. L'’exécution d'une 
demande nécessite du temps, puis le canal se trouve libre et peut exé- 
cuter la demande suivante. Tout système de service est caractérise 
par la capacité d'exécution ou le débit. La theorie des phénomènes 
d'attente a pour objet d'établir une relation entre le caractère du flux 
de demandes, le rendement d’un canal et l'efficacité du service. Pour 
caractériser l'efficacité du service on peut, suivant les conditions du 
problème et les buts des recherches, utiliser différentes grandeurs et 
fonctions, par exemple, le pourcentage moyen de demandes refustes 
et quittant le système non servies ; le temps moyen d'attente des ca- 
naux et du système en entier ; le temps moyen d'attente dans la file ; 
la probabilité pour qu'une demande soit immédiatement servie : 
la loi de répartition de la longueur des files d'attente, etc. Chacune 
de ces caractéristiques décrit, d'un côté ou de l'autre, l'aptitude du 
système à desservir le flux de demandes, ou, en d'autres termes, le 
débit du système. 

Dans le sens strict on entend par débit le nombre moyen de deman- 
des que le système est en mesure de desservir par unité de temps. 
Souvent on introduit le débit relatif, c’est-à-dire la proportion moyen- 
ne de demandes servies dans le nombre de demandes reçues. Le débit 
(tant absolu que relatif) dépend, dans le cas général, non seulement 
des paramètres du système de service mais également du caractère 
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du flux de demandes. Si les demandes arrivaient régulièrement à 
des intervalles de temps déterminés et que la durée du service était 
tout à fait déterminée, il serait facile de calculer le débit. En fait, 
les arrivées sont en général aléatoires, la plupart du temps la durée 
du service est également aléatoire. Par conséquent, le fonctionnement 
du système devient irrégulier, on voit apparaître des files d'attente 
ou bien, quand les demandes arrivent en quantités faibles, ce sont 
les stations qui doivent attendre l'unité à servir. À des arrivées aléa- 
toires des demandes se superposent les durées aléatoires de service de 
certaines demandes. Ainsi, le processus de fonctionnement d’un systè- 
me d'attente est un processus aléatoire. Pour être en mesure de donner 
des recommandations sur l’organisation d’un système, de déterminer 
son débit et lui imposer certaines exigences il y a lieu d'étudier le 
processus aléatoire se déroulant dans le système et de donner sa des- 
cription mathématique. C’est là l'objet de la théorie des phénomènes 
d'attente. 

Notons que ces dernières années, la théorie des phénomènes 
d'attente ne se borne plus à des problèmes de « service » à propre- 
ment parler, mais s'étend à divers problèmes d’automatisation indus- 
trielle où des flux de pièces à usiner peuvent être considérés comme 
des flux de demandes dont le rythme d'arrivée se trouve aléatoire- 
ment perturbé. Des problèmes particuliers de la théorie des phénomè- 
nes d’attente apparaissent dans l’organisation des transports. Les 
problèmes posés par la fiabilité des dispositifs techniques font égale- 
ment appel à la théorie des phénomènes d'attente; les caractéristi- 
ques des appareils telles que la durée moyenne de fonctionnement 
sans panne, le nombre de pièces de rechange necessaire, la durée des 
réparations, etc., peuvent être déterminées en appliquant les méthodes 
de la théorie des phénomènes d'attente. 

Des problèmes voisins de ceux de service apparaissent également 
dans la technique militaire. Les stations de guidage automatique, les 
lignes de communication, les aérodromes, les dispositifs de collecte 
et de traitement de l’information, etc., sont des systèmes d'attente, 
ayant un certain régime de fonctionnement et un certain 
débit. 

Il est difficile d’énuimérer tous les domaines d'application de la 
théorie des phénomènes d'attente. Ces dernières années elle est 
devenue une branche de la théorie des probabilités en plein 
essor. 

Dans le présent chapitre nous allons exposer les notions élémen- 
taires fondamentales de la théorie des phénomènes d'attente indispen- 
sables à tout ingénieur s'occupant de problèmes de gestion indus- 
trielle, économiques, sociaux ou inilitaires. 
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19.2. Processus aléatoire à un ensemble 
dénombrable d'états 


Le processus aléatoire se déroulant dans un système d’attente c'est 
le changement aléatoire d'état du système: changent le nombre de 
canaux occupés, le nombre d'unités dans la file d’attente, etc. Ce 
processus diffère essentiellement de ceux que nous avons étudiés 
dans les chapitres 15 à 17. La différence consiste en ce que le système 
d'attente est un système physique du type discret à un nombre fini 
(ou dénombrable) d'états *), et le passage d’un état à l’autre se fait 
par saut, à l'instant où un événement se produit (arrivée d’une nouvel- 
le demande, disponibilité d’un canal, disparition d’une demande 
de la file, etc.). 

Soit un système physique X à états dénombrables : 


Li: To, . + + Th ee. + 


A un instant quelconque t le système peut se trouver dans l’un de ces 
états. Désignons par p, (t) (4 = 1, 2, ..., n, ...) la probabilité 
pour que, à l'instant t, le système se trouve dans l'état x,. Il est évi- 
dent que pour tout £ on a: 


> Pr (t)=1. (19.2.1) 

R 
L'ensemble des probabilités p4, ({) pour un t fixé caractérise la section 
donnée du processus aléatoire se déroulant dans le système. Loin 
d'être une caractéristique exhaustive du système (par exemple, l'en- 
semble des p;4 ({) ne donne aucune idée sur la corrélation entre les 
sections), il décrit le processus assez bien et se trouve être suffisant 
pour de nombreuses applications. 

On distingue deux types de processus aléatoires à états denom- 
brables : les processus à temps discret et ceux à temps continu. Dans 
les premiers systèmes les passages d’un état à l’autre ne peuvent se 
produire qu'à des instants rigoureusement déterminés di, {2, . .., 
séparés par les intervalles de temps finis. Dans les processus aléa- 
toires à temps continu le passage du système d’un état à l’autre est 
possible à un instant quelconque. 

À titre d'exemple d’un système discret X dans lequel se déroule 
un processus aléatoire à temps continu, on peut envisager un groupe 
de rx avions attaquant le territoire de l'adversaire protégé par des 
chasseurs. On ne connaît pas d'avance ni le moment de la détection 
du groupe, ni les instants d'envol des chasseurs. Les différents états 
du système correspondent à un nombre différent d'avions abattus 


*) En mathématiques on dit qu’un ensemble, fini ou infini, est dénombra- 
ble si l’on peut énumérer tous ses termes, c’est-à-dire l'écrire comme une suite 
Aie 2 ee +) Ans ee 
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dans le groupe d'assaut, soit : 


Zo — aucun avion n'est abattu: 
z, — un avion est abattu; 
zx — k avions sont abattus; 


ZI, — R avions sont abattus. 


Sur la figure 19.2.1 on peut voir le schéma des états possibles ainsi 
que les transitions d’un état à l’autre. 

Les flèches indiquent les transiticns possibles du système. Par 
des flèches demi-circulaires on a figuré la possibilité pour le système 


Fig. 19.2.1 


de rester dans un état actuel xr,. Le système examiné se caractérise 
par des transitions irréversibles (les avions abattus ne peuvent ètre 
restilués) ; par suite, aucune transition à partir de l'état r, ne se 
trouve être possible. 

Notons que sur le schéma des transitions possibles (fig. 19.2.1) 
nous n'avons marqué que les transitions dans les états voisins sans 
figurer les sauts par plusieurs états, rejetés comme pratiquement 
impossibles. En effet, pour que le système saute par un état quelcon- 
que il faut que deux avions ou plus aient été abattus simultanément, 
mais la probabilité de cet événement est pratiquement nulle. 

Les processus aléatoires se déroulant dans Îles systèmes d'attente 
sont en général des processus à temps continu. Ceci provient de ce 
que le flux de demandes est aléatoire. Au contraire du système à 
transitions irréversibles étudié dans l'exemple précédent, dans les 
systèmes d'attente on a des transitions rérersibles : un canal peut deve- 
nir disponible, la file peut disparailr…. 

À titre d'exemple on peut considérer un système d'attente mono- 
canal (par exemple, une ligne téléphonique) dans lequel une demande 
(appel) arrivant dans un canal occupé ne fait pas la queue mais quitte 
le système (est « refusée »). On a là un système discret à temps continu 
et à deux états possibles : 

£o — le canal est libre ; 

Tr, — le canal est occupé. 

Les transitions d’un état à l’autre sont ici réversibles. Sur la 
figure 19.2.2. on a représenté les transilions possibles. 
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Le schéma des transitions possibles pour un système de ce genre 
à n canaux est donné sur la figure 19.2.3. Dans l’état x, tous les canaux 
sont libres ; dans l’état x, un canal est occupé, dans l’état x, deux ca- 
naux sont occupés, etc. 


AR, 4, (A (CA CD (A 
LE] ÉÉEGE LE) 
Fig. 19.2.2 Fig. 19.2.3 


Soit encore un exemple du système discret à temps continu, à 
savoir un système d'attente monocanal pouvant se trouver dans l’un 
des quatre ctats suivants: 


zo — le canal est en bon état et libre; 

zx, — le canal est en bon état et occupé; 

Zo — le canal est en panne et attend d’être réparé ; 
za — le canal est en panne et est en état de réparation. 


Le schéma des transitions possibles pour ce cas est donné sur la 
figure 19.2.4 *). La transition de l'état x; direc- 


tement dans z;, sans passer par zo, est pralique- = — 
ment impossible, car pour cela il faudrait que la 21 
fin de la réparation coïncide exactement avec d 7 
l'arrivée d'une demande. 


Pour décrire le processus aléatoire se dérou- A À 
lant dans un système discret à temps continu il Q ze b 
faut avant tout analyser les causes provoquant 

la transition du système d'un état à l'autre. Les Fig. 19.2.4 
processus dans les systèmes d'attente sont essen- 

tiellement déterminés par le flux de demandes. Ainsi, la description- 


mathématique de tout système d'attente commence par la description 
du flux de demandes. 


19.3. Flux d'événements. Flux simple 
et ses propriétés 


En théorie des probabilités on entend par flur d'événements une 
succession d'événements à des intervalles aléatoires ou déterminés. 
A titre d'exemple on peut citer le flux d'appels d'une centrale téle- 
phonique ; le flux de branchements des appareils consommateurs du 
courant électrique sur un réseau; le flux de lettres recommandées 
arrivant à un bureau de poste; le flux de défauts d’un ordinateur; 


*) Le schéma est établi en supposant qu'un canal qui à l'instant donné 
n'est pas en service ne peut pas tomber en panne. 
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le flux de coups lors d’une opération militaire, etc. Les événements 
formant un flux peuvent dans le cas général être très différents, mais 
ici nous n'allons envisager qu'un flux d'événements homogènes. On 
peut représenter un tel flux comme une suite de points ti, do, . .., 
hs, - -. Sur l'axe numérique (fig. 19.3.1) correspondant aux 
instants d'apparition des événements. 

Un flux d'événements est dit régulier si les événements se suivent 
à des intervalles de temps déterminés. Dans les systèmes réels on 


T 
ly L> LS ramener, £ 
pm 


0 
Fig. 19.3.1 


rencontre rareméñt des flux de ce genre, cependant ils présentent un 
certain intérêt en tant que cas limite. Pour les systèmes d’attente 
plus typiques sont des flux aléatoires de demandes. 

Dans le présent paragraphe nous allons envisager des flux d’évé- 
nements doués des propriétés particulièrement simples. A cet effet 
introduisons tout d’abord les définitions nécessaires. 

1. Un flux d'événements est dit stationnaire, si la probabilité 
pour un nombre quelconque d'événements de se produire dans un inter- 
valle de temps + (fig. 19.3.1) ne dépend que de la longueur de l’inter- 
valle et ne dépend pas de sa position sur l’axe Of. 

2. Un flux d'événements est dit sans postaction si pour tous inter- 
valles disjoints le nombre d'événements se produisant dans l’un 
d’eux ne dépend pas du nombre d'événements se produisant dans les 
autres. 

3. Un flux d'événements est dit ordinaire si la probabilité pour 
deux ou plus événements de se produire dans l'intervalle élémentaire 
Ât est négligeable devant la probabilité correspondante d’un seul évé- 
nement. 

Un flux d'événements doué de trois propriétés énumérées ci- 
dessus est appelé flux simple, ou flux stationnaire de Poisson. Il est 
dit de Poisson car si les conditions 1 à 3 sont remplies, le nombre 
d'événements se produisant dans un intervalle fixe quelconque suit 
une loi de Poisson (voir $ 5.9). 

Nous allons étudier plus en détail les conditions 1 à 3 pour voir 
ce qu'elles signifient pour un flux de demandes et ce qui peut les in- 
fluencer. 

1. La condition de stationnarité se trouve remplie pour un flux 
de demandes dont les caractéristiques probabilistes ne dépendent pas 
du temps. En particulier, un flux stationnaire a une densité constante 
(nombre moyen de demandes par unité de temps). En pratique on 
rencontre souvent des flux de demandes qui, tout au moins sur des 
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intervalles de temps limités, peuvent être considérés comme station- 
naires. Par exemple le flux d'appels que reçoit une station téléphoni- 
que urbaine entre 12 et 13 heures est pratiquement stationnaire. 
Ce même flux durant toute la journée ne saurait être stationnaire 
(la densité des appels de nuit est bien moindre que celle du jour). 
Notons qu’il en est de même pour tous les processus physiques que 
nous appelons stationnaires : en réalité ceux-ci ne sont stationnaires 
que sur des intervalles de temps limités, et si on écarte les limites vers 
l'infini c’est pour la commodité d'analyse. Dans de nombreux problè- 
mes de la théorie des phénomènes d'attente il est intéressant d'étu- 
dier le fonctionnement du système pour des conditions constantes; 
à cet effet il y a lieu de résoudre le problème pour un flux stationnaire 
de demandes. 

2. La condition d'absence de postaction, condition la plus impor- 
tante pour un flux simple, signifie que les demandes arrivent inde- 
pendamment les unes des autres. Par exemple, le nombre de voya- 
geurs entrant dans une station de métro est un flux sans postaction 
parce que les causes qui y ont amené un quelconque voyageur sont en 
général indépendantes de celles des autres voyageurs. Cependant, 
si une dépendance apparaît, l'absence de postaction n'est plus assu- 
rée. Par exemple, le flux de passagers quittant une station de métro 
ne peut être considéré comme un flux sans postaction, car les instants 
de sortie des voyageurs arrivés par la même rame sont interdépendants. 

11 faut remarquer qu’en général le flux d'unités de sortie (ou le 
flux de demandes servies) quittant le système d'attente a une post- 
action, même si le flux d'entrée n’en avait pas. Pour s’en rendre com- 
pte considérons un système d’attente monocanal pour lequel le temps 
de service d’une demande est déterminé et égal à 4er. Dans le flux 
de demandes servies, l'intervalle minimum séparant les unités quit- 
tant le système sera {e-. Il est facile de voir que l'existence de cet 
intervalle minimum conduit inévitablement à une postaction. En 
effet, supposons que l’on sache qu'à un certain instant £, une unité 
servie a quitté le système. On peut alors affirmer en toute certitude 
que dans tout intervalle de temps t compris entre £#; et ti + {ser 
aucune unité ne sera servie, ainsi il y aura une dépendance entre les 
nombres d'événements se produisant dans des intervalles disjoints. 

On doit tenir compte du phénomène de postaction inhérent au 
flux de sortie si ce flux arrive à l'entrée d’un autre système d'attente 
Ge en cascade, lorsqu'une même demande passe successivement 

e système en système). 

Notons en passant qu'un flux régulier dans lequel les événements 
sont séparés par des intervalles égaux et qui semble à première vue 
être le flux le plus simple ne l’est pas dans le sens que nous avons adop- 
té car il y a une postaction nette : les moments d'apparition des évé- 
nements dans ce flux sont liés entre eux par une relation fonctionnelle. 
La postaction fait que l'analyse des processus se déroulant dans un 
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système d'attente pour un flux régulier de demandes est bien plus 
compliquée que dans le cas simple. 

3. La condition d ordinarité signifie que les demandes arrivent 
une à une et non par deux, trois, etc. Par exemple, le flux de clients 
entrant chez un coiffeur est pratiquement ordinaire, il n’est pas de 
même du flux de jeunes mariés arrivant à la Mairie. 

Si dans un flux non ordinaire les demandes arrivent seulement 
par deux, par trois, etc., un tel flux se réduit facilement à un flux 
ordinaire, en considérant à la place du flux d'unités un flux de paires, 
un flux de triplets, etc. Tout se complique si chaque demande peut 
occasionnellement être double, triple, etc. On a alors affaire à un 
flux d'événements hétérogènes. 

Dans la suite, pour plus de simplicité, nous nous limiterons à 
l'étude des flux ordinaires. 

Le rôle joué par le flux simple, dans les flux d'événements, est 
analogue à celui de la loi normale dans les lois de répartition. On sait 
que lorsqu'on prend la somme d’un grand nombre de variables aléa- 
toires indépendantes réparties suivant des lois quelconques, le résul- 
tat suit approximativement une loi normale. D'une manière analogue 
on peut montrer que la somme (la superposition) d’un grand nombre 
de flux ordinaires, stationnaires, à postaction quelconque, est un 
flux très voisin du flux simple. Les conditions à observer sont analo- 
gues à celles du théorème central limite, à savoir les flux s’ajoutant 
doivent avoir sur la somme une influence uniformément petite. 

Sans démontrer cette assertion ni même formuler les conditions 
mathématiques auxquelles doivent satisfaire les flux, nous allons 
l’illustrer par des raisonnements élémentaires. Soit une suite de flux 
indépendants Fi, F2, ..., F, (fig. 19.3.2). Prendre la « somme » 
de ces flux consiste à rapporter les instants d'apparition des événe- 
ments à un même axe Of, comme on peut le voir sur la figure 19.3.2. 

Supposons que les flux F;, F>, . . . aient une influence comparable 
sur le flux total (c’est-à-dire que leurs densités sont du même ordre 
de grandeur) et que leur nombre soit suffisamment grand. Supposons 
de plus que cesflux soient stationnaires et ordinaires, chacun d’eux 
pouvant avoir une postaction, et considérons le flux total 


F+ > (19.3.1) 


sur l’axe Ot (fig. 19.3.2). Il est clair que le flux F doit être stationnai- 
re et ordinaire car chacune de ses composantes l’est, de plus, toutes 
les composantes sont indépendantes. Il est intuitivement clair égale- 
ment que lorsque le nombre de composantes augmente, la postaction 
dans le flux somme, même si elle était importante dans chacun des 
flux, doit peu à peu s’affaiblir. En effet, considérons sur l'axe Ot 
deux intervalles disjoints t, et t2 (fig. 19.3.2). Les points tombés 
dans ces intervalles peuvent appartenir à l’un ou l’autre de ces flux, 
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et lorsque 7 augmente, la proportion des points appartenant à un 
même flux (et donc dépendants) doit diminuer, les autres points appar- 
tiennent à des flux différents et donc tombent dans les intervalles 
T1, T2 indépendamment les uns des autres. On peut évidemment s'atten- 
dre à ce qu'avec augmentation de x le flux total n'aura pas de post- 
action et ressemblera fort à un flux simple. 

En fait, il suffit généralement d'ajouter 4 ou 5 flux pour obtenir 
un flux que l'on peut considérer comme un flux simple. 


y y 
d Ty Tr 
Fig. 19.3.2 


Le flux simple joue dans la théorie des phénomènes d'attente un 
rôle particulièrement important. Premièrement, dans les applica- 
tions on rencontre souvent des flux de demandes simples ou presque 
simples, ceci pour les raisons exposées ci-dessus. Deuxièmement, mé- 
me lorsque des flux de demandes diffèrent sensiblement des flux sim- 
ples on peut obtenir des résultats satisfaisants en remplaçant un flux 
de structure quelconque par un flux simple de même densité. C'est 
pour cela que nous allons étudier plus en détail un flux simple et ses 
propriétés. 

Considérons sur l’axe Ot un flux d'événementssimple F (fig. 19.3.3) 
comme une suite infinie de points aléatoires. 

Séparons sur l’axe Ot un intervalle de longueur +. Dans le chapitre 
9 ($ 5.9) nous avons montré que, pour les conditions 1, 2 et 3 (sta- 
tionnarite, absence de postaction et ordinarité) le nombre de points 
tombés dans l'intervalle + suit une loi de Poisson d'espérance mathé- 
matique 

a = ÀT, L (19.3.2) 
où À est la densité du flux (nombre moyen d'événements par unité de 
temps). 
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La probabilité pour que, durant le temps +, on ait exactement m 
événements est égale à: 


Pm(r) = 29 6-1. (19.3.3) 


En particulier, la probabilité pour que l'intervalle soit vide (aucun 
événement n'aura lieu) sera: 


Ps (t) = er. (19.3.4) 


La loi de répartition de la longueur de l'intervalle séparant les 
événements successifs est une caractéristique importante d'un flux 


T t 
PP A NE 
0 
Fig. 19.3.3 


Considérons la variable aléatoire T, intervalle de temps entre deux 
événements arbitraires successifs dans un flux simple (fig. 19.3.3), 
et cherchons sa fonction de répartition : 


FE =P(T<H. 
Passons à la probabilité de l'événement contraire : 
1—F(D=P(T>). 


C’est la probabilité pour que, sur un intervalle { ayant commencé à 
l'instant {, d'apparition d’un des événements du flux, aucun événe- 
ment postérieur n'apparaîtra. Comme un flux simple est sans post- 
action, la présence dans le début de l'intervalle (au point {,) d’un 
‘événement quelconque n'influe aucunement sur la probabilité d'ap- 
parition des événements postérieurs. Ceci permet de calculer la pro- 
babilité P (T > t) par la formule (19.3.4): 


P, (4) = e—Àt, 
d'où 
F(t)=1—-e-M  (=>0). (19.3.5) 
La densité de probabilité s'obtient par dérivation: 
f(t)—=Ae tt  (t> 0). .(19.3.6) 


La loi de répartition dont la densité s'exprime par (19.3.6) est 
appelée loi exponentielle, et la grandeur + son paramètre. Le graphique 
de la densité f (£) est donné sur la figure 19.3.4. 

Comme nous allons le voir plus loin, la loi exponentielle joue un 
rôle très important dans la théorie des processus aléatoires discrets 
à temps continu. C’est pourquoi nous allor l'étudier plus en détail. 
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Calculons l'espérance mathématique de la variable T répartie 
suivant la loi exponentielle : 


mi = MIT] = | tf (dt =À te-At dt, 
0 


ou, en intégrant par parties: 


me= +. (19.3.7) 
La variance de 7 a pour valeur: 
Di=D(T)= | #f(dt— = (ane-nt a, 
0 0 
d’où 
Di=S : (19.3.8) 
œ=—. (19.3.9) 


Nous allons démontrer une propriété remarquable de la loi expo- 

nentielle. Elle s'énonce comme suit : si l'intervalle de temps T réparti 
suivant une loi exponentielle dure 
déjà depuis un certain lemps —, ceci ?(t) 
n'a aucune influence sur la loi de 
répartition de la partie restante de 
l'intervalle, celle-ci sera répartie sui- 
van! la même loi que tout l'inter- 
valle T. 

Pour démontrer ceci nous consi- 
dérons un intervalle de temps aléa- 
toire 7 de fonction de répartition 4 

F(t)}=1—e-M (19.310) 
et supposons que cet intervalle dure 
déjà depuis un certain temps t, 
c'est-à-dire que l'événement T >> + a eu lieu. Déterminons pour cette 
hypothèse la loi conditionnelle de répartition de la partie restante 
T;, = T — + que nous désignons F()(f) : 
FH (D =P(T-rT<t|IT> 7). (19.3.11) 

Montrons que la loi de répartition conditionnelle F9 (t) ne dé- 
pend pas de t et qu'elle est égale à F (t). Pour calculer F(9 (£) trou- 
vons tout d'abord la probabilité du produit des deux événements : 

T>t et T—-7T<t. 
En vertu du théorème des probabilités composées on a: 
P(T>V(T—-r<H)=P(T>TP(T-T3<IIT> 7) = 
\ = P(T> +) FO (0, - 


N 


> 


Fig. 19.3.4 
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d’où 
__ P(T>T(T—-T<t)) 
POST FrSS 
Mais l'événement (T >> t) (T — rt <t) est équivalent à l'événe- 
ment T<<T<t+7 dont la probabilité est : 


PG<T<t+T)=F(t+r)—F (1). 


D'un autre côté : 

P(T>1)=1—F(:), 
par conséquent : 
F(t+t)—F(x) 
7 1—F(T 


d'où d'après la formule (19.3.10): 


—ÀT _ ,--2(1+7) 
FO (+) — + ———<— 
e 


FO (+) = 


=1—e xt —F(t). 


ce qu'il fallait démontrer. 

Nous avons ainsi démontré que si l'intervalle de temps T est ré- 
parti suivant une loi exponentielle, l'information sur la durée anté- 
rieure de cet intervalle n’a aucune influence sur la loi de répartition 
de la portion restante. On peut montrer que seule la loi exponentielle 
est douée de cette propriété, laquelle est en fait une autre formulation 
de l’absence de postaction, propriété essentielle d’un flux simple. 


19.4. Flux de Poisson non stationnaire 


La caractéristique essentielle d'un flux d'événements non sta- 
tionnaire est la densité instantanée À (t). On appelle densité instantanée 
d'un flux la limite du rapport du nombre moyen d'événements se 
produisant dans un intervalle de temps élémentaire (4, ? + At) à 
la longueur de cet intervalle pour At —+ 0: 

A (= lim-2(HA RO mr (p, (19.4.1) 

At-0 At 
où m (t) est l’espérance mathématique du nombre d'événements dans 
l'intervalle (0, &). 

Considérons un flux d'événements homogènes, ordinaire et sans 
postaction, mais non stationnaire, de densité variable À (f). Un tel 
flux est appelé flux de Pois$on non stationnaire. C'est la première étape 
de généralisation d’un flux simple. Il est facile de montrer par une 
méthode analogue à celle du $ 5.9 que pour un tel flux le nombre 
d'événements se produisant dans l’intervalle de longueur + dont l’ori- 
gine est au point £{, suit une loi de Poisson : 


Pat, t)= et (m=0, 1,2, ...), (19.4.2) 
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où a est l'espérance mathématique du nombre d'événements dans 
l'intervalle de to à to + T qui a pour valeur: 


tott 
a= | à (t) dt. (19.4.3) 


La grandeur a dépend ici non seulement de la longueur + de l'in- 
tervalle, mais également de sa position sur l'axe Ot. 

Recherchons pour un flux non stationnaire la loi de répartition 
de l'intervalle de temps 7 entre desévénements voisins: Ce flux n'étant 
pas stationnaire, la loi cherchée dépendra de la position du premier 
événement sur l’axe Ot. De plus, cette loi dépendra de la forme de la 
fonction À (t). Soit to l'instant d'apparition du premier des deux 
événements voisins ; trouvons pour cette condition la loi de réparti- 
tion du temps 7 entre cet événement et le suivant: 


Fit) = P(T<t)=1—-P(T>+t). 


La probabilité P (T > t) pour que dans l'intervalle entre t, et to + t 
aucun événement n’apparaisse est : 
to+t 
— À xmdt 
P(T>t=e"=e ! 


to+t 
_ [ad 
Fyl=1i—e ie (19.4.4) 


Par dérivation on trouve la densité de probabilite : 


 e 
fut) = À (to+t)e (> 0). (19.4.5) 


Cette loi de répartition n'est plus exponentielle. Sa forme dépend 
du paramètre f, et de la forme de la fonction À (t). Par exemple, pour 
une variation linéaire de À (t) 


À (t) = a + bt 
la densité (19.4.5) s'écrit : 


—at—biot- 


bt® 
fo (C)=1la+b(H+tlie EZ (19.4.6) 


Le graphique de cette loi pour a = 0,4; b = 2 et ts = 0,3 est donne 
sur la figure 19.4.1. 

Bien que la structure d'un flux de Poisson non stationnaire soit 
un peu plus compliquée que celle d’un flux simple, il est très commode 
pour les applications pratiques, car la propriété essentielle d’un flux 
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simple, l'absence de postaction, s’y trouve conservée. Ainsi, si l’on 
se donne sur l'axe Of un point arbitraire to, la loi de répartition fe, (?) 
du temps 7 séparant ce point du premier événement futur ne dépend 


fol) 


15 2,0 
Fig. 19.4.1 


pas de ce qui s’est passé avant l’instant 4 et au point &, c'est-à-dire 
que peu importe si d’autres événements ont eu lieu antérieurement 
ou non. 


19.5. Flux à postaction limitée (flux de Palma) 


Dans le paragraphe précédent nous avons vu une généralisation 
naturelle du flux simple, à savoir le flux de Poisson non stationnaire. 
Le flux à postaction limitée en est une autre généralisation. 

Considérons un flux ordinaire d'événements homogènes 
(fig. 19.5.1). Ce flux est appelé flux à postaction limitée (ou flux de 


Ty T2 Ts T4 
NP NS 
0 
Fig. 19.5.1 
Palma) si les intervalles de temps Ti, T;, . .. entre les événements 


successifs sont des variables aléatoires indépendantes. 

Il est clair que le flux simple est un cas particulier du flux de 
Palma : dans le flux simple les intervalles T;, T2,... sont des varia- 
bles aléatoires indépendantes réparties suivant une loi exponen 
tielle. Pour ce qui est du flux de Poisson non stationnaire, ce n’est pas 
un flux de Palma. En effet, considérons deux intervalles T, et Ti: 
dans un flux de Poisson non stationnaire. Comme nous l'avons vu 
dans le paragraphe précédent, la loi de répartition de l'intervalle 
entre des événements dans un flux non stationnaire dépend de l'ori- 
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gine de cet intervalle, le début de l'intervalle 7,,, coïincidant avec 
la fin de l'intervalle T,, alors les longueurs de ces intervalles sont 
dépendantes. 

Nous allons voir quelques exemples de flux de Palma. 

1. Une certaine pièce d’un appareil technique (un tube électro- 
nique par exemple) fonctionne d’une manière continue jusqu'à ce 
qu’elle soit hors d'usage, à ce moment elle est instantanément rem- 
placée par une autre. La durée de fonctionnement sans défaillance 


ee 
1 La Ls Ly " 
Fig. 19.5.2 


est aléatoire ; les défauts dans les différentes pièces surviennent indé- 
pendamimnent les uns des autres. Dans ces conditions le flux de défauts 
(ou le flux de réparations) est un flux de Palma. Si de plus la durée 
de fonctionnement de la pièce suit une loi exponentielle, le flux de 
Palma devient un flux simple. 

2. Un groupe d’avions va en « colonne » (fig. 19.5.2) avec une 
vitesse .V. Chaque avion sauf le chef de file doit se trouver à une cer- 
taine distance L du précédent. Vu l'erreur de mesure du radiotélé- 
mètre de bord, cette distance se trouve maintenue avec une certaine 
erreur. Les instants de traversée par les avions d'une certaine ligne 


forment un flux de Palma, car les variables aléatoires T, — £L; 
T> = 72; ... sont indépendantes. Notons que ce même flux ne sera 
plus un flux de Palma'si chaque avion tend à maintenir une distance 
constante non pas de l'avion précédent mais du chef de file. 

Les flux de Palma sont souvent des flux de sortie des systèmes 
d'attente. Un flux de demandes arrivées à un système d'attente se 
trouve divise par ce système en deux: un flux de demandes servies 
et un flux de demandes refusées. Ce dernier étant dirigé vers un autre 
système d'attente, il y a intérêt d'étudier ses propriétés. 

Le théorème de Palma, que nous énoncerons sans le démontrer, 
est le théorème fondamental de la théorie des flux de sortie. 

Supposons qu'un système d'attente reçoive un flux de demandes du 
type de Palma et qu'une demande arrivant lorsque tous les canaux sont 
occupés soit refusée. Si le temps de service suit une loi erponentielle, 
le flux des demandes refusées est également un flux de Palma. 

En particulier, si le flux d'entrée est simple, le flux des demandes 
refusées, sans être simple, sera quand même avec une postaction 
limitce. 


33— 2823 
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Un exemple intéressant de flux à postaction limitée est fourni 
par des flux d’Erlang obtenus par « tamisage » d’un flux simple. 

Considérons un flux simple (fig. 19.5.3) et prenons dans ce flux 
un point sur deux (sur la figure les points rejetés sont marqués d’une 
croix). Les points restants forment un flux qui est appelé flux d'Erlang 


EEE 


Fig. 19.5.3 


du premier ordre (£;). Ce flux est évidemment un flux de Palma, 
car de l'indépendance iles intervalles entre les événements dans un 
flux simple résulte celle des grandeurs T,, T:, . . . qui sont des sour- 
ces de deux intervalles consécutifs du flux initial. 


RÉ 


Fig. 19.5.4 


Le flux d'Erlang du second ordre s'obtient en conservant dans un 
flux simple un point sur trois en laissant tomber deux points intermé- 
diaires (fig. 19.5.4). 

D'une façon générale, on appelle flux d'Erlang d'ordre k (E;) 
le flux obtenu à partir du flux simple où l’on conserve un point sur 


T 


72 7k 


Tkss 


Fig. 19.5.5 


tous les (4 + 1) points et laisse tomber les autres. Il est évident 
qu’on peut considérer un flux simple comme un flux d'Erlang d'ordre 
zéro (Eo). 

Recherchons la loi de répartition de l'intervalle de temps T 
entre des événements voisins dans un flux d’Erlang d'ordre k (£;). 
Soit sur l’axe Ot (fig. 19.5.5) un flux simple à intervalles Ti, T2, . .. 
La grandeur 7 est une somme de k + 1 variables aléatoires indépen- 
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dantes T,(i=1,2,..., k +1): 
k+1 

T= DT, (19.5.1) 
i=i 


suivant chacune une même loi exponentielle 
f(t)—=he-M  (t>0). (19.5.2) 


Il serait possible de trouver la loi de répartition de TZ par composi- 
tion de (4 + 1) lois (19.5.2); mais il est plus facile de la déduire en 
raisonnant comme suit. 

Désignons par jf, (t) la densité de probabilité de la variable T 
pour le flux Æ, ; fs (t) dt étant la probabilité pour que la variable T 
se trouve entre £ et ? + dt (fig. 19.5.5). Ceci signifie que le dernier 
point de l'intervalle T doit tomber dans l'intervalle élémentaire 
(4, t + dt), et les k points antérieurs du flux simple dans l'intervalle 
(0, t). La probabilité du premier événement est Adt; la probabilite 
du second en vertu de la formule (19.3.2) sera : 


R 
Pa (4) = eo et, 


En multipliant ces probabilités on a: 


fn (t) dt = 102 et dt, 


d'où 


h= Een (>0). (19.5.3) 


La loi de répartition donnée par la densité de probabilité (19.5.3) 
s'appelle loi d'Erlang d'ordre k. 11 est évident que pour k — 0 elle 
devient une loi exponentielle, c’est-à-dire 


fo(t)=Ae At (> 0). (19.5.4) 


Recherchons les caractéristiques de la loi d’Erlang f, (1), à savoir 
son espérance mathématique m, et sa variance D,. En vertu du théo- 
rème d'’addition des espérances mathématiques on a: 

hk+1 
MR = 2 mo =(k +1) mo, 


où My == _ est l'espérance mathématique de l'intervalle entre les 
événements dans un flux simple. 
Il en résulte: 


k+1 
ma = + | 


(19.5.5) 


3 
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De méme, le théorème d'addition des variances donne : 


Tu k 


D,= =" = VE, (19.5.6) 


La densité A, du flux £, est l'inverse de m",, soit : 


À 2 
Ar = RIT : (19.5.7) 

Ainsi, lorsque l’ordre du flux d'Erlang augmente, l'espérance 
mathématique et la variance de l'intervalle de temps séparant les 
événements successifs augmentent et la densité du flux diminue. 

Nous allons voir quelles modifications subit le flux d’'Erlang lors- 
que À —+ oo, mais la densité reste constante. À cet effet, normons T 
de telle sorte que son espérance mathématique (et, par conséquent, 
la densité du flux) reste constante. Pour cela il nous faut change: 
l'échelle des temps en considérant au lieu de T la grandeur 
FT T 
1 FRET . 


Ce flux est dit flux d'Erlang normé d'ordre k. La loi de répartition de 
l'intervalle 7 entre les événements de ce flux sera : 


pu R 
Fa (e)= ED et (0), (19.5.9) 
où y — À (k + 1), ainsi: 
Fa = LG te At (0). (19.53.10) 


(19.5.8) 


L'espcrance mathématique de la variable T répartie suivant la loi 
(19.5.10) ne dépend pas de k, elle est égale à : 


= 1 
Mr =Mo= Re; 


où 4 est la densité du flux, égale pour # quelconque à la densité du 
flux initial simple. La variance de T est égale à : 


= Dy 1 198. 
Dy = ri KG) (19.09.11) 
ct décroit indéfiniment lorsque À augmente. 

Ainsi on arrive à la conclusion suivante : lorsque k augmente indé- 
finiment, le flux normé d'Erlang tend vers un flux réguiier à intervalles 
constants égaux à 1/À. 

Cette propriété des flux d'Erlang est très commode pour les appli- 
cations pratiques: en choisissant À convenablement on peut varier 
dans de larges limites la puissance de postaction, de l’absence totale 
(k — 0) jusqu'à une relation fonctionnelle déterminée entre les ins- 
tants d'apparition des événements (4 = co). L'ordre du flux d’{r- 
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lang peut donc servir de mesure de postaction d’un flux. Pour sim- 
plifier le problème, sou. nt il est commode de remplacer le flux réel 
de demandes, avec postaction, par un flux d’Erlang normé ayant 
approximativement les mêmes valeurs de l’espérance mathématique 
et de la variance de l'intervalle entre les arrivées de demandes. 


E xcomple. Par traitement statistique des durées T des intervalles 
entre les demandes on a obtenu les estimations suivantes de l'espérance mathé- 
matique et de la variance de 7: 

my = 2 (mn), D: = 0,8 (mn?). 


Remplacer ce flux par un flux d'Erlang normé de mêmes caractéristiques. 
Solution. Ona: 


kel 0,5 
mt 
La formule (19.5.11) donne: 
1 
k+1= D,A2 = —* k — 4. 


On peut remplacer le flux en question par un flux d’Erlang normé d'ordre 4. 


19.6. Temps de service 


En plus des caractéristiques du flux des arrivées, le régime de 
fonctionnement du système dépend également des caractéristiques 
du système : du nombre de canaux r et de la rapidité de fonctionne- 
ment de chacun des canaux. Une des caractéristiques essentielles 
du système est le femps de service d'une demande Tr. Cette grandeur 
peut être tant déterminée qu'aléatoire. Il est évident que le cas d’un 
temps de service aléatoire est plus général. 

Considérons la variable aléatoire Tr et désignons par G ({) 
sa fonction de répartition: 


G(t) = P (Tser Lt) (19.6.1) 
et par g (£) la densité de probabilité : 
g (t) = G” (+). (19.6.2) 


Le plus grand intérêt pour les applications pratiques présente le 
cas Où JZ'xr suit une loi exponentielle : 


g(t)=pe-nt ({> 0), (19.6.3) 
où le paramètre U est une grandeur inversement proportionnelle au 
temps moyen de service d'une demande: 

1 
HU — CTI Mt = M (Tser]. (19.6.4) 


La place particulière occupée dans la théorie des phénomènes 
d'attente par la loi de répartition exponentielle de 7ser est liée à 
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la propriété de cette loi démontrée au $ 19.4. Appliquée au temps 
de service, cette propriété s’énonce: si à un instant quelconque to 
une demande est en cours de service, la loi de répartition du temps que 
durera le service ne dépend pas du temps écoulé dès le début du service. 

A première vue il peut paraître artificiel de supposer que le temps 
de service soit reparti suivant une loi exponentielle. Dans certaines 
applications il semble plus naturel de le supposer non aléatoire ou 
réparti suivant une loi normale. Cependant dans certaines condi- 
ue le temps de service suit réellement une loi voisine de l’exponen- 
tielle. 

Ce sont tout d'abord les cas où le service se réduit à une série 
d’« essais » dont le résultat apparaît avec une probabilité égale à p. 


ORNE RS 
0 
Fig. 19.6.1 


Supposons que le « service » consiste à tirer dessus un objectif 
et se termine par sa destruction. On tire des coups indépendants avec 
une vitesse de À coups par unité de temps. Chaque coup atteint le 
but avec une probabilité égale à p. Pour ne pas être obligé de tenir 
compte du moment de chaque coup on suppose que ceux-ci sont tirés 
à des instants aléatoires et forment un flux simple F de densité À 
(fig. 19.6.1). 

Séparons dans ce flux un flux de « bons » coups (marqués d'un 
cercle sur la figure 19.6.1). On dit qu'un coup est « bon » s’il'atteint 
son but (à moins que le but ne fût pas atteint avant). Il est facile de 
voir que les « bons » coups forment également un flux simple F* 
de densité À -= Ap (car le flux initial F est simple et chaque coup peut 
atteindre le but indépendamment des autres avec une probabilité 
égale à p). La probabilité pour que le but soit atteint avant l'instant 
t sera: 

G(t) = P (ser Lt) == 1—e7it, 


d’où la densité de probabilité du temps de « service »: 
g (E)== Aer At, 


mais c'est l'expression d'une loi exponentielle de paramètre = A. 

On peut également utiliser d'une manière approchée la loi expo- 
nentielle. Le temps de tir avant destruction de l'objectif peut être 
supposé réparti suivant une loi exponentielle, bien que d'une maniere 
approchée, également dans le cas où les coups ne forment pas un flux 
simple mais sont séparés par des intervalles de temps réguliers f#, 
si toutefois la probabilité p de destruction par un coupn'est pas trop 
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grande. Pour illustrer ce qui vient d'être dit nous allons porter sur 
un même graphique (fig. 19.6.2) la fonction de répartition du temps 
de tir avant le coup destructeur (courbe en échelons) pour le cas 
p = 0,4; ti = 1, et la fonction de répartition de la loi exponentielle 
de paramètre u = p = 0,4 (courbe continue). On voit que la loi 
exponentielle traduit bien le caractère croissant de la fonction de 
répartition pour le cas discret. Naturellement, la correspondance est 
meilleure si les instants des coups ne sont pas strictement déterminés. 


Fig. 19.6.2 


L'exemple qui vient d’être envisagé n'est pas l'unique cas où 
le service est une série d’« essais ». On peut rapporter à ce type de 
service le dépistage des défauts des dispositifs techniques, lorsque 
la recherche des pièces défectueuses se fait en les testant l’une après 
l'autre. On peut y rapporter également les problèmes où le « service » 
est la détection d’un objectif quelconque par un radar, si l’objectif 
peut, avec une certaine probabilité, être détecté par chaque tour d’ho- 
rizon. 

La loi exponentielle décrit bien les processus où la densité de 
probabilité du temps de service, pour une raison ou une autre, decroît 
lorsque l’argument t croît, Ceci a lieu lorsque la majorité des deman- 
des se trouvent servies très rapidement et que les retards importants 
de service sont très rares. Soit, par exemple, le guichet d'un bureau de 
poste, où l’on peut acheter des enveloppes et des timbres et d’où 
l’on peut envoyer des expéditions et des mandats. La majorité des 
clients achètent des timbres et des enveloppes et sont très rapidement 
servis. L'envoi de lettres recommandées est plus rare et il faut un peu 
plus de temps pour servir ces clients. Les mandats sont encore plus 
rares et leur expédition dure encore plus longtemps. Enfin parfois, 
mais c'est très rare, les expéditeurs envoient à la fois une grande quan- 
tité de lettres. L’histogramme de la répartition du temps de service 
est represente sur la figure 19.6.3. Comme la densité de probabilits 
décroît lorsque { augmente, on peut, sans commettre de grande erreur, 
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approcher la répartition en question par la loi exponentielle, à con- 
dition de choisir convenablement son paramètre pu. 

Bien entendu, la loi exponentielle n’est pas la loi universelle de 
répartition du temps de service. Dans beaucoup de cas c’est la loi 
d'Erlang qui décrit mieux le temps de service. Heureusement, le 
débit et certaines autres caractéristiques des systèmes d'attente dé- 
pendent peut de la formé de la loi du temps de service, mais essentiel- 
lement de sa valeur moyenne m: ,,. C'est pourquoi, dans la théorie 


Fig. 19.6.3 
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des phénomènes d'attente, on suppose que le temps de service est 
réparti suivant la loi exponentielle. Cette hypothèse permet de sim- 
plifier l'appareil mathématique utilisé pour la solution des problèmes 
posés par des phénomènes d'attente et dans de nombreux cas de trou- 
ver des formules analytiques simples pour les caractéristiques du 
débit du système. 


19.7. Processus aléatoire de Markov 


Les hypothèses que le flux de demandes est poissonien et la loi 
de répartition du temps de service exponentielle sont d'autant plus 
avantageuses qu'elles permettent d'appliquer à la théorie des phé- 
nomènes d'attente la théorie des processus aléatoires de Markov. 

On dit que le processus se déroulant dans un système physique 
est un processus de Markov (ou processus sans postaction), si à 
chaque instant la probabilité d'un état quelconque du système dans le 
futur dépend seulement de l'état du système à l'instant actuel (t,) sans 
dépendre de la manière dont le système a été amené dans cet état. 

Nous allons voir un exemple particulièrement simple du proces- 
sus aléatoire de Markov. Un point X se déplace au hasard sur l’axe 
des abscisses Ox. A l'instant £ = 0 le point X se trouve à l'origine 
des coordonnées (z — 0) et y reste durant une seconde. Au bout de 
cette seconde on jette une pièce de monnaie ; si l’on obtient pile, le 
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point X se déplace d’une unité de longueur à droite, si l’on obtient 
face, le déplacement est à gauche. Une seconde après on jette de nou- 
veau une pièce de monnaie et on effectue un nouveau déplacement 
du point en conformité du côté apparu, etc. Les déplacements aléa- 
toires du point forment un processus aléatoire à temps discret (£ — 
— 0, 1, 2, ...) et à états dénombrables: 


L1= 0; mel; ri = 1; 22; T5 = —2;:;;: 


‘in a montré sur la figure 19.7.1 le schéma des transitions possibles 
Jour ce processus. 

Nous allons montrer que c’est un processus de Markov. En effet, 
supposons pour fixer les idées qu'à un certain instant {, l’état du sys- 


Fig. 19.7.1 


tème est x, : le point se trouve à une distance unité à droite de l’ori- 
gine des coordonnées. Dans une seconde que nous prenons pour unité 
de temps le point se trouvera dans l’une des positions z, ou r: avec 


les probabilités + et + « dans deux secondes il occupera l’une des posi- 


| ee ; 141 1 1 De 
tions z_1, Zi, z: avec les probabilités respectives — , —, 7 et ainsi de 


suite. Il est évident que toutes ces probabilités dépendent de la posi- 
tion du point à l'instant &, et ne dépendent pas du tout de la manière 
dont il y est arrivé. 

Soit un autre exemple. Un dispositif technique X se compose 
d'éléments (pièces) des types a et b ayant une durée de vie différente. 
Ces éléments peuvent se trouver défectueux indépendamment les uns 
des autres et à des instants aléatoires. Pour que le dispositif fonction- 
ne il faut que tous les éléments soient en bon état. La durée de fonc- 
tionnement sans défaillance d’un élément est une variable aléatoire 
à répartition exponentielle; pour les éléments des types a et b les 
paramètres de cette loi sont différents et respectivement égaux à 
À. et À+. En cas de défaut du dispositif des mesures sont immédiate- 
ment prises pour en trouver les causes et l'élément défectueux est 
instantanément remplacé par un neuf. Le temps de réparation du 
dispositif est réparti suivant une loi exponentielle de paramètre pu, 
si c'est un élément du type a qui s’est trouvé défectueux, et pe si 
c'est un élément du type b. 

Dans cet exemple le processus aléatoire se déroulant dans le systè- 
me est un processus de Markov à temps continu et à nombre fini d'états: 

To — aucun élément n'est défectueux, le système fonctionne ; 
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z, — un élément du type a est défectueux, le système est en répa- 
ration *); 

T2 — un élément du type b est défectueux, le système est en répa- 
ration. 

Sur la figure 19.7.2 on peut voir le schéma des transitions possibles. 

En effet, le processus est markovien. Supposons qu’à l'instant t, 
le système se trouve dans l'état zo (bon état de fonctionnement). 
Comme la durée de fonctionnement sans défaillance de chaque élé- 
ment est exponentielle, l'instant de sa défaillance 
future ne dépend pas du temps écoulé dés le début 
du fonctionnement de l'élément. Ainsi, la proba- 
bilité pour le système de rester dans l’état x, et 
d’en sortir ne dépend pas de la préhistoire du 
processus. Supposons maintenant qu’à l'instant to 
le système se trouve dans l’état x, (un élément 
du type a est défectueux). Comme le temps de 

Fig. 19.7.2 réparation suit également une loi exponentielle, 

la probabilité pour que la réparation soit finie 
à un instant quelconque après {, ne dépend pas du début de la répara- 
tion ni du moment où les autres éléments ont été montés. Le proces- 
sus étudié est donc bien markovien. 

Notons que la répartition exponentielle du temps de fonctionne- 
ment sans défaillance d’un élément et celle du temps de réparation 
sont des conditions essentielles sans lesquelles le processus ne saurait 
être markovien. En effet, supposons que le temps de fonctionnement 
sans défaillance d’un élément suive une loi autre qu'exponentielle, 
par exemple, la loi uniforme sur l'intervalle (f,, {). Ceci signifie 
que chaque élément est garanti de fonctionner durant le temps t; 
et sur l'intervalle de #, à {> peut être en défaut à un instant quelcon- 
que avec une même probabilité. Supposons qu'à l'instant £{, un élé- 
ment soit en bon état. La probabilité pour que l'élément soit en dé- 
faut, sur un intervalle de temps quelconque dans le futur, dépend 
évidemment du temps écoulée depuis sa mise en place, c’est-à-dire 
de la « préhistoire », et le processus ne saurait être markovien. 

Il en est de même du temps de réparation T,; si la loi n’est pas 
exponentielle et qu'un élément soit en réparation à l'instant 4, 
le temps que durera encore la réparation en cours dépendra de l’ins- 
tant où elle a été commencée, par suite, ce processus ne sera non plus 
markovien. 

En général, la loi exponentielle joue un rôle particulièrement 
important dans la théorie des processus markoviens à temps continu. 
Il est facile de voir que dans un processus markovien stationnaire le 
temps durant lequel le système reste dans un état quelconque est tou- 


*) On suppose que les défauts ne peuvent survenir que quand le système 
fonctionne: la probabilité de deux ou plusieurs défauts simultanés est négli- 
geable. 
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jours réparti suivant une loi exponentielle (dont le paramètre dépend 
en général de cet état). En effet, supposons qu'à un instant £, le sys- 
tème se trouve dans l’état x, et ceci dépäis un certain temps. Par défi- 
nition d’un processus de Markov, la probabilité d’un événement quel- 
conque dans le futur ne dépend pas de la préhistoire du processus ; 
en particulier, la probabilité pour que le système sorte de l’état x, 
durant le temps f n’a aucune raison de dépendre du temps que le sys- 
tème a passé dans cet état. Par conséquent, le temps que le système 
passera dans l’état r, doit suivre une loi exponentielle. 

Lorsque le processus se déroulant dans un système physique à 
états dénombrables et à temps continu est markovien, il peut être 
décrit par des équations différentielles ordinaires où les fonctions in- 
connues sont les probabilités p1 ({), p2 (t), . . . des états. La manière 
d'écrire et de résoudre ces équations va être exposée dans le paragra- 
phe suivant sur l'exemple d’un système d'attente simple. 


19.8. Système d'attente à demandes refusées. 
Equations d’Erlang 


Les systèmes d'attente peuvent être classés en deux groupes: 
a) les systèmes à demandes refusées et b) les systèmes à file d'attente. 

Dans les systèmes du premier groupe une demande apparaissant 
à un instant où tous les canaux sont occupés est immédiatement refu- 
sée, elle quitte le système et n'est plus compteée. 


Fig. 19.8.1 


Dans les systèmes du deuxième groupe une demande trouvant tous 
les canaux occupés ne quitte pas le système, mais prend sa place dans 
la file en attendant qu'un canal quelconque se soit disponible. Nous 
commençons par le cas le plus simple, le cas d'un système à demandes 
refusces. 

Soit un système d'attente à z canaux à demandes refusées. Nous 
allons l’envisager comme un système physique X à un nombre fini 
d'états: 

zo — tous les canaux sont libres ; 
z, — un seul canal est occupé ; 
Zn — k canaux sont occupés ; 
zh — tous les 7 canaux sont occupés. 


Le schéma des transitions possibles est donné sur la figure 19.8.1. 
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Proposons-nous de déterminer les probabilités p, (t) (k = 0, 
1, ..., n) des états du système pour un instant quelconque t. La 
solution est basée sur les hypothèses suivantes : 

1) le flux de demandes est simple, de densité À: 

2) le temps de service T- suit une loi exponentielle de para- 


mètre p — 
Îser 

g(t)=mpe-#  (1> 0). (19.8.1) 

Notons que le paramètre u dans la formule (19.8.1) est analogue 


au paramètre ?. de la loi exponentielle de répartition de l'intervalle T 
entre les événements voisins d'un flux simple: 


f(t=2e-M (150). (19.8.2) 


Le sens du paramètre À est la « densité du flux de demandes ». D'une 
manière analogue la grandeur u peut être interprétée comme la « den- 
sité du flux de disponibilités » d'un canal occupé. En effet, supposons 


72 


Fig. 19.8.2 


qu'un canal soit occupé en permanence (les demandes arrivent d'une 
manière continue) ; il est clair qu'alors dans ce canal on aura un flux 
de « disponibilités » de densité pu. 

Comme les deux flux sont simples, le processus se déroulant dans 
le système sera markovien. 

Considérons les états possibles du système et leurs probabilités : 


Po (2), Pi (2), ss Pn (e). (19.8.3) 
Il est évident qu'à un instant quelconque on a: 
Y Ph (£) = 1. (19.8.4) 
k:=20 


Ecrivons les équations différentielles pour toutes les probabilités 
(19.8.3) en commençant par po ({). Fixons l'instant t et recherchons 
la probabilité po ({ + At) pour qu'à l'instant £t + At le système se 
trouve dans l’état r, (tous les canaux sont libres). Ceci peut avoir 
lieu de deux façons différentes (fig. 19.8.2): 

A — à l'instant t le système se trouvait dans l’état zo et durant 
le temps At il n'est pas passé à l'état x; (aucune demande n'a été 
reçue) ; 

B — à l'instant t le système se trouvait dans l’état x,, durant le 
temps At le canal s’est libéré et le système est passé à l'état ro. 
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Sur la figure 19.8.2 on a inontré par des flèches dirigées vers l’état 
x, comment le système peut y arriver à l'instant £ + At; la flèche 
issue de x, est barrée pour marquer que le système ne doit pas quitter 
l’état Lo- 

La probabilité de sauter un état (de passer, par exemple, 
directement de x: à x, Sans s’arrèter dans x.) durant un laps de temps 
court est négligeable devant les probabilités P (A) et P (B) *). 

En vertu du théorème des probabilités totales on a: 


Pott+ At) = P (4) + P (B). (19.8.5) 


Nous allons utiliser le théorème des probabilités composées pour 
trouver la probabilité de l'événement À. La probabilité pour que, 
à l'instant f, le système se trouve dans l’état x, est égale à p, (t). La 
probabilité pour que, durant l'intervalle A!{, aucune demande ne soit 
reçue est égale à e-Mt. On a approximativement : 


e-MAt Z 1 — At. (19.8.6) 
Par conséquent, 
P (A) & po (t) (1 — AAD). 


Calculons P (B). La probabilité pour qu’à l'instant t le système 
se trouve dans l'état z, est égale à p; (t). La probabilité pour que, du- 
rant l'intervalle Af le canal soit disponible est égale à 1 — e-uât: 
on a approximativement : 


1—e-n8t Z pAt. 
Par conséquent, 
P (B) & pi (+) uAt. 
D'où 
Po (t + At) & po (+) (1 — À At) + up (t) At. 


En faisant passer po (f) dans le premier membre, puis en.divi- 
sant par Af ct en passant à la limite pour Af —+ O0, on obtient l’équa- 
tion différentielle cherchée pour po (t): 


oO ps (t) + up (1). (19.8.7) 


On peut trouver des équations différentielles analogues pour les 
probabilités des autres états. 

Fixons un k (0 < k < n) quelconque et éalculons la probabilité 
Pr (t + At) pour qu'à l'instant { + At le système se trouve dans 
l’état r, (fig. 19.8.3). Cette probabilité peut être calculée comme la 


*) Dans la suite nous allons négliger les termes d'ordre de petitesse plus 


élevé que At. A la limite pour At —+ 0 les égalités approchées deviendront 
exactes. 
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probabilité de la somme non plus de deux mais de trois événements 
(nombre de flèches dirigées vers l’état x): 

A — à l'instant t le système se trouvait dans l'état x; (k canaux 
occupés) et durant le temps At il n’est pas passé ni dans z41, ni 
dans x, _, (aucune demande n'est arrivée, aucun canal n'est devenu 
disponible) ; 

B — à l'instant ft le système se trouvait dans l'état z,_, (4 — 1 
canaux occupés) et durant le temps At il est passé dans x, (une de- 
mande a été reçue) ; 

C — à l’instant £ le système se trouvait dans l'état z,41 (4 + 1 
canaux occupés) et durant le temps At un canal a été libéré. 


Fig. 19.8.3 


Calculons P (4). Recherchons tout d'abord la probabilité pour 
que durant le temps At aucune demande ne soit arrivée, aucun 
canal ne soit disponible: 


e—AAt (e—nAt)} — e—(A+hu)At, 
En négligeant les infiniment petits d'ordre élevé on a: 
e-A+AWAt SZ 1 — (1 + ku) At, 


P (4) & pr (t) [1 — (À + ku) Ail. 
D'une manière analogue 
P(B) = pr-1(t) AAt, 
P(C) & Pr (t) (k +1) pât 
Pr (+ At) & pr (t)[1— (À + Au) At] + 
+ Pu-s (6) AA + Pres (#) (k +1) nAt. 
D'où l'équation différentielle pour p, (1) (0<k< n): 


PRO ps (9) — (+ Eu) pa (6) + (+ 1) Mau (6). 


Ecrivons l'équation correspondant à la dernière probabilité p, (t) 
(fig. 19.8.4). On a: 
Pn (+ At) Æ pa (t)(1—nuAt) + pas () A At, 


où 1 — nuAt est la probabilité pour que durant le temps At aucun 
canal ne soit disponible ; ÀAAt la probabilité pour que durant ce temps 
At une demande arrive. On obtient ainsi l'équation différentielle 


d’où 


et 
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pour pa (): 
dPn (!) 
re = ÀPn-1 (t) —nppa (+). 


Ainsi, on a obtenu un système d'équations différentielles pour les 
probabilités p; (4), p2 (t), .- . ., Pan (t): 


A — À po (t) + up: (t), 
= Pas (€) — (À + AU) pa (8) + 
+ (+1) upxn(t) (0<Kk<n), 


(19.8.8) 


PR = Apns (!) — RU Pa (0 


Les équations (19.8.8) sont appelées équations d'Erlang. En inté- 
grant le système (19.8.8.) pour les conditions initiales 


Po (0) = 1; p1(0) = ... = pa (0) = 0 


(à l'instant initial tous les canaux sont libres) on obtient p, ({) pour 
tout À. Les probabilités p, (f) caractérisent le taux moyen d’occupa- 
tion du système et sa variation dans le temps. En particulier, p, (t) 


FRE 


Fig. 19.8.4 


est la probabilité pour que la demande arrivée à l'instant £ trouve 
tous les canaux occupés (soit refusée) : 


Pet = Ph (£). 


La grandeur q (t) — 1 — p, (t) est appelée pouvoir de transmission 
relatif du système. A l'instant f{ c'est le rapport du nombre moyen de 
demandes servies par unité de temps au nombre moyen de demandes 
arrivées. 

L'intégration du système d'équations différentielles linéaires 
(19.8.8) est assez facile pour un nombre quelconque de canaux n. 

Notons que pour la déduction des équations (19.8.8) on n’a nulle 
part supposé que les grandeurs À et u (densité du flux de demandes et 
du flux de « disponibilités » sont constantes. Les équations (19.8.8) 
restent vraies lorsque À (?), u (£) dépendent du temps, il suffit que les 
flux d'événements faisant passer le système d'un état à l’autre soient 
poissoniens (sans cela le processus ne sera pas markovien). 
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19.9. Régime permanent de service. 
Formules d'Erlang 


Considérons un système d'attente à n canaux à demandes refusées 
dont l'entrée reçoit un flux de demandes simple de densité À; le 
temps de service suit une loi exponentielle de paramètre u. La ques- 
tion qui se pose est de savoir si le processus aléatoire se déroulant 
dans le système est stationnaire. Il est clair qu’au début, tout de suite 
après la mise en marche du système, le processus ne sera pas station- 
naire : dans le système d'attente (comme dans tout système dynami- 
que) apparaît un processus transitoire. Cependant quelque temps 
apres ce processus s’amortit et régime de fonctionnement du système 
devient stationnaire ou permanent. Ses caractéristiques ne dépendent 
plus du temps. 

Dans de nombreuses applications on a besoin de connaître les 
caracteristiques du régime de service permanent limite. 

On peut montrer que dans tout système à demandes refusées ce 
régime limite existe, c'est-à-dire que pour £ — œ toutes les probabi- 
lités po (ft), P1 (t), .- . ., pa (t) tendent vers des limites constantes 
Por Pi, - - +» Pn et toutes lcurs dérivées, vers zéro. 

Pour trouver les probabilités limites po, P1, - . ., Pr (probabili- 
tés des états du système en régime permanent) remplaçons dans les 
équations (19.8.8) toutes les probabilités p4 (4) (0< À < n) par 
leurs limites p, et supposons nulles toutes leurs dérivées. A la place 
d’un système d'équations différentielles on obtient un système d'’é- 
quations algebriques, soit : 


— À po + 2 =0, 
ÀPo—(à-+u) pi + 2up2 = 0, 
A Pas — (À + ku) pa + (+1) pus =0 (OLA <n), (19.9.1) 


APn-2—{[À+(n—1{)u] pr-1 + np =0, 
À Pn-1 —7UPn = 0. 


11 faut ajouter à ces équations la condition 


D Ph = 1. (19.9.2) 
R=0 


Le système (19.9.1) est résolvable par rapport aux inconnues po, 
Pis + ++ Pn- La première équation donne: 


p, =+ Po (19.9.3) 
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la seconde, compte tenu de (19.9.3), donne: 
1 | 12 2 
Pr y [— po +(À +) rl = 7 | —AP0+ 2 Po+ Apr | = 7 Po; 


(19.9.4) 


d'une manière analogue, compte tenu de (19.9.3) et (19.9.4), on ob- 
tient à partir de la troisième équation: 
1 À2 13 A2 13 
Ps ( —— Pot 53 Po + jus 2H Po) —31ps Po 


et pour 4 < n quelconque 


Ah 
Pr = PE Po- (19.9.5) 
Introduisons la désignation 
L = a (19.9.6) 


et appelons la grandeur «& densité rapportée du flux de demandes. 
Ce n’est rien d'autre que le nombre moyen de demandes rapporté 
au temps moyen de service d’une demande. En effet : 


À 
œ Tu == AM ter 


où Mer — M [Ter] est le nombre moyen de service d'une demande. 
Dans les nouvelles désignations la formule (19.9.5) devient : 


kR 
Pa = Po- (19.9.7) 


La formule (19.9.7) donne toutes les probabilités p, en fonction de 
Po- Pour les exprimer directement en fonction de «& et de r servons- 
nous de la condition (19.9.2). En y substituant (19.9.7) on obtient : 


n n 
D Pr = Po > 1, 
Rk=0 Rk=—0 


d'où 
Po= ——. (9.9.8) 
ak 
kl 
k::0 
En substituant (19.9.8) dans (19.9.7) on obtient finalement : 
a 
Pa" (0<k<n). (19.9.9) 
h 


34 — 2823 R=0 
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Les formules (19.9.9) sont appelées formules d’'Erlang. Elles don- 
nent la loi de répartition limite du nombre de canaux occupés en 
fonction des caractéristiques du flux de demandes et du taux de servi- 
ce du système. En posant dans la formule (19.9.9) À = r on obtient 
la probabilité d'un refus (probabilité pour qu'une demande arrivée 
au système trouve tous les canaux occupés) 

an 


Pret = Pn= —"—. (19.9.10) 
ah 
D 
R=0 


En particulier, pour un système monocanal (7 — 1) on a: 


Pret = = (19.9.11) 
et le débit relatif 
1 
g—=1—2, Ed. (19.9.12) 


Les formules d’Erlang (19.9.9) et les formules (19.9.10) à (19.9.12) 
en découlant ont été trouvées dans l'hypothèse que le temps de service 
suit une loi exponentielle. Cependant, il a été montré *) que ces for- 
mules restent vraies quelle que soit la loi de répartition du temps de 
service, à condition toutefois que le flux des arrivées soit simple. 


E xemple. Une station téléphonique automatique a 4 Din de com- 
munications. Les appels forment un flux simple de densité À = 3 (appels par 
minute). Tout appel arrivé lorsque toutes les lignes sont occupées est refusé **). 
La durée moyenne de conversation est 2 minutes. Trouver: a) la probabilité 
ue refus Pres et b) la probabilité po pour que la station téléphonique soit 
ibre. 

Solution. On a miser — 2 (mn); 


u=0,5 (conv/mn); a=+=6. 


a) La formule (19.9.10) donne: 
ai 
4 


0,47. 


Pret = Pa = ai 


œ az , ai 
Et Tr tar 
b) La formule (19.9.8) donne: 


1 
Po = a . a? , as at æ& 0,0087. 
1+rtsr ta ta 


*) Voir, par exemple, B. Sévastianov. Théorème ergodique pour les proces- 
sus markoviens et son application aux systèmes téléphoniques à appels refusés (en 
russe). « Théoria véroïatnostei i éye priménénia », vol. 2, n° 1, 1957. 

**) On suppose que les appels répétés des abonnés refusés ne changent 
pas le caractère poissonien du flux de demandes. 
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19.10. Système d'attente à files 


Un système d'attente est dit à files si aucune demande n'est refu- 
sée mais prend sa place dans la file en attendant d’être servie. 

Si le temps d’attente d'une demande n'est pas limité, le système 
est appelé système à file illimitée. Si le temps d'attente est limité 
par une condition quelconque, le système est du type mixte. C'est 
le cas intermédiaire entre un système à demandes refusées et un systè- 
me à file illimitée. 

Dans les applications, les systèmes mixtes presentent le plus 
d'intérêt. 

Les restrictions imposées à l'attente sont très variées. Souvent 
on limite le temps d'attente des demandes dans la file, en lui impo- 
sant une limite supérieure TAà&, qui peut être tant deéterministe 
qu'aléatoire. Cette limite concerne seulement le  ternps 
d'attente dans la file tandis que le service, une fois commencé, 
se termine indépendamment du temps. passé à faire la queue (par 
exemple, un client ayant occupé un fauteuil chez un coiffeur ne le 
quitte plus jusqu'à la fin du service). Dans d’autres problèmes il est 
plus naturel de limiter non pas le temps d'attente mais le temps qu'u- 
ne demande passe dans le système, y compris le service (par exem- 
ple, une cible aérienne ne peut se trouver dans la zone du tir qu'un 
temps limité et la quitte que le bombardement soit fini ou non). 
Enfin on peut envisager un système mixte (par exemple, les organi- 
sations vendant des produits qui ne sont pas de première necessite) 
où une demande fait la queue seulement si celle-ci n’est pas trop lon- 
gue. Ici la limitation est imposée au nombre de demandes dans la 
file. 

Pour les systèmes d'attente à file, on introduit la notion très 
importante de « discipline d'attente ». Les demandes peuvent être 
servies dans l’ordre d'arrivée (celui qui est arrivé avant est servi 
avant) ou choisies au hasard. Il y a des systèmes où certaines deman- 
des jouissent d’une priorité de service (par exemple, les malades acci- 
dentés sont admis d'urgence). 

Chaque type de systèmes d'attente a ses particularités et sa thco- 
rie mathématique, la plupart d’entre eux sont étudiés dans le cours 
de B. Gnédenko « Leçons sur la théorie des phénomènes d'attente » 
(en russe), Kiev, 1960. 

Nous n'envisagerons ici que le cas le plus simple d’un système 
mixte, qui est une généralisation naturelle du problème d'Erlang 
pour un système à demandes refusées. Nous écrirons pour ce cas des 
équations différentielles analogues aux équations d’Erlang, et les 
formules pour les probabilités des états dans le régime permanent 
analogues aux formules d’Erlang. 

Considérons un système d'attente mixte X à r canaux pour les 
conditions suivantes. Le flux de demandes est simple de densité À, 


34" 
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Le temps de service Te d'une demande suit une loi exponentielle 


x 1 > 
de paramètre u = —— . Une demande ayant trouvé tous les canaux 


ser 
occupés attend d'être servie; le temps d'attente est limité à Ta, 
si avant ce temps la demande n'est pas servie, elle quitte la file. On 
suppose que le temps d'attente T;t est aléatoire et réparti suivant 
une loi exponentielle : 


h(t)=ve-vt (> 0), 


où le paramètre v est une grandeur inversement proportionnelle à la 
durée moyenne de l'attente : 


ee: Mar = M [Tat]. 


Le paramètre v peut être interprété comme la densité du flux de 
demandes quittant la file sans être servies, tout comme les paramètres 
À et le sont respectivement pour le flux de demandes et le flux de 
« disponibilités » des canaux. En effet, imaginons une demande qui 
ne fait que prendre la place dans la file, attendre le temps T;t et par- 
tir pour revenir immédiatement dans la file. Alors le flux des départs 
d'une telle demande aura justement une densité égale à v. 

Il est évident que pour v —+ oo un système du type mixte devient 
un système à demandes refusées ; pour v —+ 0 il devient un système 
à file illimitée. 

Notons que lorsque la durée d'attente suit une loi exponentielle 
le taux de service du système ne dépend pas du fait que les demandes 
sont servies par ordre ou aléatoirement, car pour une demande quel- 
conque la loi de répartition du temps qu'elle doit encore attendre dans 
la file ne dépend pas du temps que cette attente a déjà duré. 

En supposant poissoniens tous les flux d'événements donnant lieu 
à des changements d'état du système, on obtient que tout processus 
se déroulant dans ce système est markovien. Nous allons écrire les 
équations pour les probabilités des états du système. A cet effet, 
énumérons tout d’abord ces états, en étendant la numération aux de- 
mandes dans la file. Nous dirons qu'une demande est « liée » au 
système si elle est en train d'être servie ou si elle attend son tour 
d'être servie. Les états possibles du système sont: 


Zo — aucun canal n’est occupé (aucune demande n'attend), 
z, — un canal est occupé (aucune demande n'attend), 


z, — k canaux sont occupés (aucune demande n'attend), 
z, — tous les r canaux sont occupés (aucune demande n'attend), 
Zn+, — tous les 7 canaux sont occupés (une demande attend), 
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Zh+, — tous les nr canaux sont occupés (s demandes attendent), 


Le nombre de demandes dans la file est illimité. Ainsi, le système 
X est à un nombre infini d'états (bien que dénombrable). Le nombre 
d'équations différentielles décrivant ce système sera également infini. 

Il est clair que les nr premières équations différentielles ne se 
distinguent en rien des équations correspondantes d'Erlang : 


PO A ps(t)+ Hp: (6). 


ce 0 = pas (4) — (A+ kp) pa (#) + (k + 1) UPuss (t), 


La différence apparaîtra pour À — n. En effet, un système 
à demandes refusées peut arriver dans l’état x, seulement à partir de 
l'état x, _; ; au contraire, un système à file d'attente peut passer dans 
l’état x, non seulement à partir de x, _;, mais également à partir de 
Tn+1 (tous les canaux sont occupés, une demande attend dans la file). 

Nous allons écrire l’équation différentielle pour p, (t). Fixons un 
instant £ et trouvons la probabilité p, (£ + At) pour qu’à l'instant 
t + At le système se trouve dans l’état z,. Ceci peut se produire de 
trois manières différentes : 

1) à l'instant t le système se trouvait déjà dans l’état z, et durant 
Atn'en est pas sorti (aucune demande n'est arrivée et aucun des ca- 
naux ne s'est libéré); 

2) à l’instant £ le système se trouvait dans l'état zx,_, et durant 
At est passé à l’état x, (une demande est arrivée); 

3) à l'instant t le système se trouvait dans l'état z,,4, (tous les ca- 
naux occupés, une demande attend) et durant At il est passé à l’état 
z, (ou bien un canal s’est libéré et une demande de la file d'attente 
l'a occupé, ou bien une demande a quitté la file par suite de l’écou- 
lement du temps d'attente). 

On a 


Pn (+ At) Æ pa (t) (1— At — nuÂt) + pas (t) AAC + Puss (4) (ru +v) Aë, 
d'où 


0 = — (À + nu) Pa (t)-+ APn-s (€) + (ru + v) pass (6). 


Calculons maintenant p,+, ({t + At) pour s> 0 quelconque, 
c'est-à-dire la probabilité pour que, à l'instant t{ + At tous les n 
canaux soient occupés et s demandes soient dans la file d'attente. 
Ceci peut également avoir lieu de trois manières différentes : 
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4) à l'instant t le système se trouvait déjà dans l'état Zh+s et du- 
rant At cet état n'a pas changé (ce qui signifie qu'aucune demande 
n'est arrivée, ni aucune des s demandes dans la file ne l’a quittée) : 

2) à l'instant t£ le système se trouvait dans l’état z,+,_,,et durant 
At il est passé à l’état z,,, (une demande est arrivée); 

3) à l’instant { le système se trouvait dans l’état x,:.:, et durant 
At il est passé à l’état x,,, (pour cela il faut qu’ou bien un canal se 
libère et alors une des s + 1 demandes de la file l’occupe, ou bien 
une des demandes de la file parte sans être servie, le temps d'attente 
s'étant écoulé). 

Par conséquent : 

Pn+e (+ At) & Pass (#) (1 — AAÏ — nuAt — SvAt) + pays-s (6) AA + 
où Pn+s+1 (£) [ru + (s + 1) v] At, 
d'où 
Para O (+ np + sv) pass (0 + 
+ APn+s-1 (€) + [ru + (s + 1) V] Pa4s+1 (6). 

On obtient ainsi pour les probabilités des états un système infini 

d'équations différentielles : 


d 
PO _ — À po (t) + up: (£), | 


ai PO Lin (#9) — (A+ pu) pi (6) + 2upe (6), 


< 40 = À pa-s (8) — (A + ku) pa (E) + (k +1) Bpuss (E) (LEE R— 4), 


a O pas (4) — (A+ RU) Pn (6) + (ri + V) Pr (6). 


Pate OÙ pis (6) — (4 + RH + SV) Pass (0) + 
+ [np (s+ 1) v] Pass (0), 


(19.10.1) 


Les équations (19.10.1) sont une généralisation naturelle des équa- 
tions d'Erlang pour le ‘cas d'un système mixte à temps d'attente 
limité. Les paramètres À, u, v dans ces équations peuvent être tant 
constants que variables. Lors de l'intégration du système (19.10.1) 
il faut tenir compte du fait que, bien que le nombre théorique d'états 
possibles du système soit infini, en fait les probabilités p,+, (ft), 
lorsque s augmente, deviennent infiniment petites et l’on peut ne 
pas tenir compte des équations correspondantes. 

Ecrivons maintenant les formules analogues aux formules d’Er- 
lang pour les probabilités des états du système en régime de service 
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{permanent pour { —> co). On peut à partir des équations (19.10.1), 
supposant toutes les p, (4 = 0, ..., n, . ..) constantes et toutes 
les dérivées nulles, obtenir le système d'équations algébriques 


suivans : 
—Àpo+HP,=0, | 
À Po—(À +) Pi + 2up2 = 0, 


À Ps — (À + ku) pr + (k +1) Upru = 0 
(A<Lk<n—1), 


(19.10.2) 


A ces équations il faut ajouter la condition : 


à Pa =1. (19.10.3) 


Nous allons chercher la solution du système (19.10.2). 

A cet effet nous allons procéder comme dans le cas d'un système 
à demandes refusées : nous allons résoudre la première équation par 
rapport à p1, substituer la solution dans la seconde, etc. Pour k<n 
quelconque, tout comme dans le cas d'un système à demandes refusées 


On 4: 1A 
Ph = Flux Po- (19.10.4) 


D'une manière analogue, pour les équations pour 4 > nr (k — n + 
+ s, s > 1) on obtient: 
An*1po 
Pn+1 alu Qu +) ! 
Ant2m 
Pate Tue np) (nv) 
et en général pour s quelconque s > 1: 


à (19.10.5) 


Pn+s — F 
nlun [[ (ru+mv) 
m= 1 


La probabilité p, est présentée dans les deux formules (19.10.4) 
et (19.10.5). On peut la trouver à partir de la condition (19.10.3). 
En y substituant les expressions (19.10.4) et (19.10.5) pour 4< nr 
et s > 1 on obtient 


Le k cé n+s 
Po à >, + —"— _" 
h=0 À si niun [[ (nn + my) 


cs 
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d’où 

= = Fe : (19.10.6) 
AN 

S = — 

 klu +2 onlur [| (nu + mv) 

Rk=0Q 4=1 Hal 


Transformons les équations (19.10.4), (19.10.5) et (19.10.6) en y in- 
troduisant les densités rapportées & et B au lieu des densités À et v: 


(19.10.7) 


Les paramètres « et B expriment respectivement le nombre moyen 
d’arrivées et le nombre moyen de départs des demandes non servies 
par le temps moyen de service d’une demande. 

Les équations (19.10.4), cn et (19.10.6) s'’écrivent alors: 


Pa == Po (O<k<n); (19.10.8) 
ants 
nl Po 
Pnts= —— (s> 1); (19.10.9) 
[[ (+8) 
Po = = —— (19.10.10) 
S' 0er 5 
2 À ff 4m 


En substituant (19.10.10) dans (19.10.8) et (19.10.9) on obtient 
définitivement pour les probabilités des états du système les expres- 
SiOns : 


ah 
EC APRES Au (O<k<n); (19.10.11) 
24 er tt 2 ] «+np) ni (n + mf) 
an e AS 
"nl s 
Il (n + mf) 
De (s5>1). (49.10.12) 


nu NOR 


55 rt 5 fers Î + 
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Connaissant les probabilités de tous les états du système on peut 
facilement trouver d’autres caractéristiques, en particulier la proba- 
bilité P4ep pour qu'une demande quitte le système sans être servie. 
A cet effet nous raisonnons comme suit : en régime permanent la pro- 
babilité Paep n’est rien d'autre que le rapport du nombre moyen de 
demandes quittant la file d'attente par unité de temps au nombre 
moyen de demandes arrivées par unité de temps. Cherchons ce nom- 
bre moyen de départs par unité de temps. À cet-effet calculons tout 
d’abord l'espérance mathématique m, du nombre de demandes dans 
la file : 


sas 
a FD Qui Il (n + mB) 
ms = M [s] = Ÿ D (19.10.13) 
et A+ LAN D 
kI T'nl 
k=0 s=1 Il. (n + mp) 


Pour obtenir Pa il faut multiplier m, par 7 « densité moyenne 
de départs » v d’une demande et le diviser par la densité moyenne des 
arrivées À, c'est-à-dire introduire le coefficient : 


On a alors: 


Pa =: —— "°°" — ————. (19.10.14) 


ss R n + s 

D en D —— 

k=0 s=1 [I (nr + mB) 
m= 1 


Le débit relatif du système est caractérisé par la probabilite 
pour toute demande arrivée au système d'être servie : 


Il est clair que le débit d'un système, à file d'attente pour des À 
et u donnés, est toujours supérieur au débit d'un système à demandes 
refusées : en effet, les demandes arrivées dans le système lorsque tous 
ses n canaux sont occupés ne quittent pas tout le système mais seule- 
ment une partie d'entre elles. Le débit augmente avec le temps moyen 


d'attente Mt = _ : 


538 ÉLÉMENTS DE LA THÉORIE DES PHÉNOMÊÈNES D'ATTENTE [CH. 19 


Il est quelque peu difficile d'utiliser les formules (19.10.11), 
(19.10.12) et (19.10.14) car elles contiennent des sommes infinies. 
Cependant, les termes de ces sommes décroissent rapidement en va- 
leur *). 

Voyons ce que deviennent les formules (19.10.11) et (19.10.12) 
pour B —+ oo et B —+ 0. Il est évident que pour B —+ oo un système 
à file d'attente devient un système à demandes refusées (une demande 
trouvant le système occupé le quitte immédiatement). En effet, pour 
B —> co les formules (19.10.12) donneront des zéros, et les formules 
(19.10.11) deviendront les formules d’'Erlang pour un système à de- 
mandes refusées. 

Dans l’autre cas limite où B — 0, les demandes arrivées ne quit- 
tent jamais la file, donc Psp = 0; tôt ou tard toute demande est 
servie. Par contre, dans un système à file illimitée le régime perma- 
nent pour { — © n'existe pas toujours. On peut montrer qu'un tel 
régime existe seulement pour & << n, c’est-à-dire lorsque le nombre 
moyen d'’arrivées rapporté au temps de service d’une demande, n’est 
pas au-delà des limites des possibilités d’un système à n# canaux. 
Pour & > n, le nombre de demandes dans la file augmentera indéfi- 
niment avec le temps. 

Supposons que «<< rx et calculons les probabilités limites p}4 
(0 < k << n) dans le cas d’un système à file illimitée. A cet effet dans 
les formules (19.9.10), (19.9.11) et (19.9.12) posons $ —+ 0. Il vient: 


| 
Po = n co ? 
ah an as 
2 El al 2 en 
Rk= s= 1 


ou en prenant la somme de la progression (ce qui n’est possible que 
pour œ << n): 


Be —_— (19.10.15) 


*) Une estimation grossière de l’erreur due au fait de négliger tous les 
termes de la somme à partir du r-ième peut être donnée par les formules suivantes: 
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D'où, en utilisant les formules (19.10.8) et (19.10.9), on obtient : 


pR=—" (0<k<n), (19.10.16) 


et d’une manière analogue pou k=n+s(s > 0) 
ant+s 


DR (19.10.17) 
- ar an+l 
_ kl + nl(n—) 


Le nombre moyen de demandes dans la file est donné par la formule 
(19.10.13) pour B —+ 0: 


RER DRE ER (19.10.18) 


Exemple. Dans un système à trois canaux à temps d’attente illimité 
arrive un flux de demandes simple de densité À — 4 (demandes par heure). 
Le temps moyen de service d’une demande est m,  — 30 mn. Trouver si le 


régime permanent de service est possible; si oui, trouver les probabilités po, pi, 
P2, Ps, la probabilité d'une file et sa longueur moyenne m,. 


Solution. Onau— = 2, a = ——= 2. Comme a < n, le régi- 


m, mn 
me permanent est possible. La formule (19.10.16) permet de trouver: 


La probabilité d'une file est : 
Prie=1—(Po+ Pi + P2+ Ps) — 0,297. 
La longueur moyenne de la file d'attente est donnée par la formule (19.10.18): 
ms © 0,89 (demande). 


19.11. Système du type mixte à longueur 
de file limitée 
Dans le paragraphe précédent nous avons étudié un système 


à temps d'attente limite. Ici nous allons envisager un système du 
type mixte où la limitation concerne le nombre d'unités dans la file 
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d'attente. Supposons qu'une demande ayant trouvé tous les canaux 
occupés ne fasse la queue que si celle-ci contient moins de m deman- 
des ; si au contraire ce nombre est égal à m (il ne peut pas lui être 
supérieur) la dernière arrivée quitte le système sans être servie. Les 
autres hypothèses, celles sur les arrivées poissoniennes et la réparti- 
tion exponentielle du temps de service, restent inchangées. 

Ainsi, on a un système à z canaux à file d'attente, dans lequel 
le nombre de demandes dans la file est limité et égal à m. Nous allons 
écrire les équations différentielles pour les probabilités d'états du 
système. Notons que dans le cas considéré le nombre d'états du systè- 
me sera fini, car le nombre total de demandes acceptées par le systè- 
me ne peut être supérieur à r + m (nr en cours de service et m dans la 
file). Les états possibles du système sont : 


zo — tous les canaux sont libres, aucune demande n'attend, 


z, — un canal est occupé, » » » 

zx — k canaux sont occupés, » » » 

Zn — AR — À canaux sont occupés, » » » 

Zn — tous les r canaux sont occupés, » » » 

Zh+s — tous les nr canaux sont occupés, une demande dans la 
file, 


Zn+m — tous les r canaux sont occupés, m demandes dans la file. 
Il est évident que les nr premières équations pour les probabilites 


Po (t), - -., Pn_1 (t) coïncident avec les équations d'Erlang (19.8.8). 
Nous allons trouver les autres équations. On a: 


Pn (+ At) = Pn-1 (€) AA + pa (t) (1 — At — nuAt) + pass (t) ruAt, 
d'où 


Sen 0 = À Pas (4) — (À + nu) pa (t) + rUpan,: (4). 


Trouvons maintenant l'équation pour phr,(t) (1<s<m): 
Pn+s (£ + At) — 

= Pn+s-1 (4) AAT + Pass (£) (1 — At — nuÂt) + Dnss+1 (4) nAt, 
d'où 


dPn+s 
P = (4) = ÀPn+r-1 (£) ni (À + nu) Pn+s (£) + RUPn+s+1 (£). 


La dernière équation sera : 


d n+m 
Sas E = \Pnim=1 (£)— NU Pn+m (t)- 
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On a ainsi obtenu un système de (nr + m “+ 1) équations diffe- 
rentielles : 


—" 


oO A p5(#) + Ps (6), 


SPerr ( = ÀPn+m-1 —RHPn+m (t). 


Le 


(19.11.1) 


Considérons le cas limite pour {+ oo. En annulant toutes les déri- 
vées et supposant toutes les probabilités constantes, on obtient le 
système d'équations algébriques suivant: 


RAS \ 


ÀPn-1 — (A +R) Pn + RUPnn =0, { (19.112) 


ÀPn+m-1 — 7H Pn+m = 0 


et la condition supplémentaire : 


ntm 


D pr =1. (19.11.3) 
k=0 


Les équations (19.11.2) se résolvent tout comme les équations 
algébriques analogues des paragraphes précédents ; sans nous arrêter 
sur les opérations intermédiaires, nous donnons ici les formules défi- 
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nitives, soit: 


où 
D k! 
one , (0<k<n), (19.11.4) 
> F+w > (+) 
Rh=0 s= | 
an /aæœ\ 
Pn+s nr (5) 
FAO Nr TE , (A<s<m).  (19.11.5) 
2 H + 2 (%) 


La probabilité pour qu'une demande quitte le système sans être 
servie est égale à la probabilité p,+:, que la file contienne déjà m 
demandes. 

Il est facile de voir que les formules (19.11.4) et (19.11.5) s'obtien- 
nent à partir des formules (19.10.11) et (19.10.12) en y posant B = 0 
et en limitant la sommation à s = m. 


E xèémple. Une station de service d’automobiles reçoit un flux de 
demandes simple de densité À — 0,5 (voitures par heure). La station dispose 
d’un seul atelier de réparation; de plus, trois voitures aux maximum peuvent 
attendre dans la cour leur tour d’être servies. Le temps moyen de réparation 


d’une voiture est Ter — La = 2 (heures). Trouver: a) le débit du système; 


b) le temps moyen où la station est inoccupée; c) voir comment changeront 
ces caractéristiques si on ba encore un atelier de réparation. 
Solution. On a: ÀA—=0,5; p—=0,5; &« — 1; m = 3. 
a) En posant n — 1 dans la formule (19.11.5) on trouve la probabilité 
pour la voiture de quitter le système sans être servie: 


1 
Paép—=P1+3 = TH1+3 = 0,20. 


Le débit relatif du système est g — 1 — Pas) — 0,80. Le débit absolu: Q — 
= 1. 0,4 (voitures par heure). 

à Le temps moyen où la station est inoccupée est donné par la formule 
(19.11.4): 


1 
Po—="5-— 0,20. 
c) En posant n = 2 on trouve: 
1 
46 
14 , 1 1 1 
++ +rts+x 
q = 1 — Paép Æ 0,979 (c'est-à-dire qu'environ 98 % de toutes les demandes 


de service seront satisfaites) : 
Q = Àg = 0,49 (voitures par heure). 


—= SE 0,021, 


1 
Paëp= P2+3— 47 


Le temps moyen d’inoccupation est po = D & 0,34, c'est-à-dire qu’à 


peu près 34 % du temps les ateliers seront inoccupés. 


x O® (x) 
—0,00 | 0,5000 
—0,01| 4960 
—0,02! 4920 
—0,03| 4880 
—0,04| 4840 
—0,05| 4801 
—0,06| 4761 
—0,07| 4721 
—0,08| 4681 
—0,09| 4641 
—0,10 | 0,4602 
—0,11| 4562 
—0,12| 4522 
—0,13| 4483 
—0,14| 4443 
—0,15| 4404 
—0,16| 4364 
—0,17| 4325 
—0,18] 4286 
—0,19| 4247 
—0,20 | 0,4207 
—0,21| 4168 
—0,22| 4129 
—0,23| 4090 
—0,24| 4052 
—0,25| 4013 
—0,26| 3974 
—0,27| 3936 
—0,28| 3897 
—0,29| 3859 


ANNEXES 


Table 1 
Valeurs de la fonction de répartition normale 
1 
1 < —5t 
O®(z)=—— (e ? dt 
7) 

à | x O® (x) a | x O® (x) | À | x O%(x)| A 
40 1—0,30 | 0,3821 | 38 

40 | —0,31 3783 | 38 

40 |—0,32| 3745] 38 

40 |—0,33| 3707| 38 

39 1—0,34| 3669 | 37 

40 |[—0,351 3632| 38 

40 1—0,37| 3557] 37 

40 |—0,38| 3520| 37 

39 1—0,39| 3483] 37 

40 1 —0,4010,3446 | 37 

40 | —0,41| 3409| 37 

39 [—0,42!1 3372! 36 

40 1—0,43| 3336| 36 

40 1—9,45| 3264 | 36 

39 |—0,46! 3228| 36 

39 | —0,47| 31921 36 

39 |—0,48| 3156| 35 

40 | —0,49| 31211 36 

39 1 —0,50 | 0,3085 | 35 

39 1—0,51| 3050! 35 

39 1—0,52| 3015] 34 

39 |—0,541 2946| 34 

39 1—0,551 2912] 35 

38 |—0,56| 2877 | 34 

39 1—0,57| 2843! 33 

38 1—0,581 2810 | 34 

38 |—0,59] 2776| 33 
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Suite table 1 


—1,20 | 0,1151 | 20 | —3,00|0,0014| 4 | 0,35 |0,6368| 38 
—1,21| 1131] 49 | 3,10| 0010! 31 0,36 | 6406| 37 
—1,22| 1112 3,20| 0007! 2 | 0,37 | 6443| 37 
—1,23| 1093 ,30| 0005| 2] 0,38 | 6480| 37 
—1,24| 1075 0455| 9|-—3,40| 0003! 1 | 0,39 | 6517] 37 
—1,25| 1056 0,0446 | 10 |—3,50! 0002! o | 0,40 |0,6554| 37 
—1,26| 1038 0436| 943,60! 0002! 1/1 0,41 | 6591] 37 
—1,27| 1020 0427| 9—3,70| 0001| 0! 0,42 | 6628| 36 
—1,28| 1003 0418| 9!—3,80| 0001! 1] 0.43 | 6664| 36 
—1,29| 0985 0409| 83,90! 0000 0,44 | 6700| 36 
—1,30 | 0,0968 0401| 9! 0,00 0,5000| 40 | 0.45 | 6736| 36 
—1,31| 0951 0392| 8! 0,01! 5040! 40-| 0,46 | 6772] 36 
—1,32| 0934 0384| 9! 0,02| 5080! 40 | 0,47 | 6808| 36 
—1,33| 0918 0375| 8! 0,03| 5120| 40 | 0,48 | 6844| 35 
—1,34| 0901 0367| 8! 0,04| 5160! 39 | 0,49 | 6879| 36 
—1,35| 0885 0,0359| 8! 0,05| 5199] 40 | 0,50 |0,6915| 35 
—1,36| 0869 0351| 71 0,06| 5239| 40 | 0,51 | 6950| 35 
—1,37| 0853 0344| 8 0,07| 5279| 40 | 0,52 | 6985| 4 
—1,38| 0838 0336| 7{| 0,08! 5319] 40 | 0,53 | 7019] 35 
1,39] 0823 0329| 7] 0,09! 5359| 39 | 0,54 | 7054] 3% 
— 1,40 | 0,0808 0322| 8] 0,10/0,5398| 40 À 0,55 | 7088| 35 
—1,41| 0793 0314| 7| 0,11| 5438| 40 À 0,56 | 7123| 34 
—1,42| 0778 0307| 6| 0,121 5478| 39 | 0,57 | 7157| 33 
—1,43| 0764 03%1| 7 0,13] 5517| 40 | 0,58 | 7190| 34 
—1,44| 0749 0294| 6| 0,14| 5557| 39 | 0,59 | 7224| 33 
—1,45| 0735 0,0288| 7 0,15] 5596| 40 | 0,60 |0,7257| 34 
—1,46| 0721 0281| 7} 0,16| 563%6| 39 | 0,61 | 7291| 33 
—1,47| 0708 0274| 6| 0,17| 5675| 39 | 0,62 | 7324| 33 
—1,48| 0694 0268| 6{| o0,18| 5714| 39 | 0,63 | 7357| 32 
—1,49| 0681 0262| 6! 0,19| 5753| 40 | 0,64 | 7389] 33 
—1,50 | 0,0668 0,20 l0,5793 | 39 | 0,65 | 7422| 32 
—1,51| 0655 0.21| 5832] 39 | 0,66 | 7454| 32 
—1,52| 0643 0,22| 5871| 39 | 0,67 | 7486| 1 
—1,53| 0630 0,23| 59140| 38 | 0,68 | 7517| 32 
—1, 0618 0,24| 5948| 39 | 0,69 | 7549| 31 
—1,55| 0606 0,25| 5987| 39 | 0,70 |0,7580 | 31 
—1,56| 0594 0,26| 6026| 38 | 0,71 | 7611| 31 
—1,57| 0582 0,27| 6064 | 39 | 0,72 | 7642| 31 
1. 0571 0,28| 6103| 38 | 0,73 | 7673| 30 
—1,59| 0559 0,29| 61411 38 | 0,74 | 7703| 31 
—1,60 | 0,0548 0,30 |0,6179| 38 | 0,75 | 7734| 30 
—1,61| 0537 0,31| 6217| 38 | 0,76 | 7764| 30 
—1,62| 0526 0,32| 6255| 38 | 0,77 | 7794| 29 
—1,63| 0516 0,33| 6293| 38 | 0,78 | 7823| 29 
—1,64| 0505 0,34| 6331| 37 | 0.79 | 7852] 29 
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Suite table 1 


x D (x) 
0,80 |0,7881 
0,81 7910 
0,82 7939 
0,83 7967 
0,84 7995 
0,85 8023 
0,86 8051 
0.87 8078 
0,88 8106 
0,89 8133 
0,90 | 0,8159 
0,91 8186 
0,92 8212 
0,93 8238 
0,94 | 8264 
0,95 8289 
0,96 8315 
0,97 8340 
0,98 8365 
0,99 | 8389 
1,00 | 0,8413 
1,01 8437 
1,02 8461 
1,03 8485 
1,04 8508 
1,05 8531 
1,06 8554 
1,07 8577 
1,08 8599 
1,09 8621 
1,10 | 0,8643 
1,11 8665 
1,12 8686 
1,13 8708 
1,14 8729 


D® (x) 
1,15 10,879 
1,16 8770 
1,17 8790 
1,18 8810 
1,19 8830 
1,20 |0,8819 
1,21 8869 
1,22 8888 
1,23 8907 
1,24 8925 
1,25 8944 
1,26 8962 
1,27 8980 
1,28 8997 
1,29 9015 
1,30 | 0,9032 
1,31 9049 
1,32 9066 
1,33 9082 
1,34 90659 
1,35 9115 
1,36 9131 
1,37 9147 
1,38 9162 
1,39 9177 
1,40 |0,9192 
1,41 9207 
1,42 9222 
1,43 9236 
1,44 9251 
1,45 9265 
1,46 9279 
1,47 9292 
1,48 9316 
1,49 9319 


x DS (x) 
1,50 |0,9332 
1,91 9345 
1,92 9357 
1,53 9370 
1,54 9382 
1,99 9394 
1,96 9406 
1.57 9418 
1,58 9429 
1,59 9441 
1,60 |0,9452 
1,61 9463 
1,62 9474 
1,63 9484 
1,64 9495 
1,65 9505 
1,66 9515 
1,67 9525 
1,68 9535 
1,69 9545 
1,70 |0,9554 
1,71 9564 
1,72 9573 
1,73 9582 
1,74 9591 
1,79 9599 
1,76 9608 
1,77 9616 
1,78 9625 
1,79 9633 
1,80 |0,9641 
1,81 9649 
1,82 9656 
1,83 9664 
1,84 9671 
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Table 2 


Valeurs de la fonction ex 


0,00 | 1,000 | 10 |! 0,40 | 0,670 | 7 | 0,80 | 0,449 | 4 À 3,00 | 0,050 | 5 
0,01 | 0,990 | 10 | 0,41 | 0,664 | 7 | 0,81 | 0,445 | 5 ! 3,10 | 0,045 | 4 
10 42 657 | 7 82 440 | 4 1 3,20 41 4 
03 970 | 9 43 650 | 6 83 436 | 4 | 3,30 37 | 4 
04 961 | 10 44 644 | 6 84 432 | 5 | 3,40 33 | 3 
05 951 | 9 45 638 | 7 85 427 | 4} 3,50 30 | 3 
06 942 | 10 46 631 | 6 | 86 423 | 4 | 3,60 27 2 
07 932 | 9 47 625 | 6 87 419 | 4 | 3,70 25 3 
08 923 | 9 48 619 | 6 À 38 415 | 4 | 3,80 22 | 2 
09 914 | 9 49 613 | 7 | 89 411 | 41 3,9 20, 2 
0,10 | 0,905 | 9 | 0,50 | 0,606 | 6 | 0,90 | 0,407 | 4 | 4,00 |0,0183 | 17 
11 896 | 9 91 6 5) 91 403 | 4 | 4,10 166 | 16 
12 887 | 9 92 595 | 6 92 399 | 4 | 4,20 150 | 14 
13 878 | 9 53 589 | 6 | 93 395 | 4 | 4,30 136 | 13 
14 869 | 8 54 583 | 6 94 391 | 4 | 4,40 123 | 12 
15 861 | 9 99 977 | 6 95 387 | 4 | 4,50 111 | 10 
16 852 | 8 56 571 | 6 383 | 4 | 4,60 101 | 10 
17 844 | 9 97 565 | 9 97 379 | 41 4,70 |0,0091 9 
18 835 | 8 58 960 | 6 98 375 | 3 | 4,80 82 | 8 
19 827 | 8 59 5 99 372 | 4 | 4,90 74 7 
0,20 | 0,819 | 8 | 0,60 | 0,549 | 6 | 1,00 | 0,368 | 35 | 5,00 |0,0067 6 
21 811 | 8 1 543 | 5 | 1,10 333 | 31 | 5,10 61 6 
22 803 | 8 62 538 | 5 | 1,20 302 | 29 | 5,20 99 J 
23 795 | 8 63 533 | 6 | 1,30 273 | 26 | 5,30 50 cs) 
24 787 | 8 64 527 | © | 1,40 247 | 24 | 5,40 45 | 4 
29 779 | 8 65 522 | 5 | 1,50 223 | 21 | 5,50 41 4 
26 771 | 8 66 517 | 5 | 1,60 202 | 19 } 5,60 37 | 4 
27 763 | 7 67 512 | 5 | 1,70 183 | 18 | 5,70 33 3 
28 756, 8 68 507 | 5 | 1,80 165 | 15 | 5,80 30 | 3 
29 748 | 7 69 502 | 5 | 1,90 150 | 15 | 5,90 27 2 
0,30 | 0,741 | 8 0,70 | 0,497 | 5 à 2,00 | 0,435 | 13 ! 6,00 |0,0025 | 3 
31 733 | 7 1 492 | 5 | 2,10 122 | 11 } 6,10 22 | 2 
32 726 | 7 72 487 | 5 | 2,20 111 | 11 | 6,20 20 2 
33 719 | 7 73 482 | 5 | 2,30 100 | 91 6,30 18 1 
34 712 | 7 74 477 | 5 À 2,40 | 0,091 | 9 & 6,40 17 2 
35 705 | 7 79 472 | 4 |] 2,90 82 | 8} 6,50 15 1 
36 698 | 7 76 468 | 5 | 2,60 74 | 766,60 14 | 2 
37 691 | 7 77 463 | 5 | 2,70 67 | 616,70 12 1 
38 684 | 7 78 458 | 4 | 2,80 61 | 6} 6,80 11 1 
39 677 | 7 79 454 | 5 | 2,90 55 | 95 À 6,90 10 1 
0,40 | 0,670 0,80 | 0,449 | 3,00 | 0,050 7,00 | 0,0009 
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Valeurs du 7° pour 
P 
"+ 0,99 0,98 0,95 0,90 0,80 0,70 0,50 
1 0,000 | 0,001 0,004 0,016 | 0,064 | 0,148 | 0,455 
2 0,020 | 0,040 | 0,103 0,211 0,446 | 0,713 1,386 
3 0,115 | 0,185 | 0,352 | 0,584 1,005 1,424 | 2,37 
4 0,297 0,429 0,711 1,064 1,649 2,20 3,36 
5 0,554 | 0,752 1,145 1,610 | 2,34 3,00 4,35 
6 0,872 1,134 1,635 | 2,20 3,07 3,83 5,939 
7 1,239 1,564 2,17 2,83 3,82 4,67 6,35 
8 1,646 | 2,03 2,73 3.49 4,59 2,93 7,34 
9 2,09 2,53 3,32 4,17 5,38 6,39 8,34 
10 2,56 3,06 3,94 4,86 6,18 7,27 9,34 
11 3,05 3,61 4,58 5,58 6,99 8,15 10,34 
12 3,57 4,18 5,23 6,30 7,81 9,03 | 11,34 
13 4,11 4,76 5,89 7,04 8,63 9,93 | 12,34 
14 4,66 5,37 6,57 7,79 9,47 10,82 | 13,34 
15 5,23 5,98 7,26 8,55 | 10,31 11,72 | 14,34 
16 5,81 6,61 7,96 9,31 11,15 12,62 | 15,34 
17 6,41 7,26 8,67 10,08 | 12,00 | 13,53 | 16,34 
18 7,02 7,91 9,39 | 10,86 | 12,86 | 14,44 | 17,34 
19 7,63 8,57 10,11 11,65 | 13,72 15,35 | 18,34 
20 8,26 9,24 | 10,85 12,44 14,58 | 16,27 19,34 
21 8,90 9,92 11,59 | 13,24 15,44 | 17,18 | 20,3 
22 9,54 10,60 | 12,34 | 14,04 | 16,31 18,10 | 21,3 
233 10,20 | 11,29 | 13,09 | 14,85 | 17,19 | 19,02 | 22,3 
24 10,86 | 11,99 | 13,85 | 15,66 | 18,06 | 19,94 | 23,3 
25 11,52 | 12,70 | 14,61 16,47 | 18,94 | 20,9 24,3 
26 12,20 | 13,41 15,38 | 17,29 | 19,82 | 21,8 25,3 
27 12,88 14,12 46,15 | 18,11 | 20,7 22,7 26,3 
28 13,56 | 14,85 | 16,93 18,94 | 21,6 23,6 27,3 
29 14,26 15,57 | 17,11 19,77 | 22,5 24,6 28,3 
30 14,95 | 16,31 | 18,49 | 20,6 23,4 25,5 29,3 


différents r et p 


ANNEXES 


0,30 0,20 0,10 0,05 0,02 0,01 0,01 a 
1,074 | 1,642 | 2,71 | 3,84 | 5,41 | 6,64 | 10,83 { 
2,41 | 3,22 | 4,60 | 5,99 | 7,82 | 9,21 | 413,82 2 
3,66 | 4,64 | 6,25 | 7,82 | 9,84 | 11,34 | 16,27 3 
4,88 | 5,99 | 7,78 | 9,49 | 11,67 | 13,28 | 18,46 4 
6,06 | 7,29 | 9,24 | 141,07 | 13,39 | 15,09 | 20,5 5 
7,23 | 8,56 | 10,64 | 12,59 | 15,03 | 16,81 | 22,5 6 
8,38 | 9,80 | 12,02 | 14,07 | 16,62 | 18,48 | 24,3 7 
9,52 |411,03 |! 13,36 | 15,51 | 18,17 | 20,1 | 26,1 8 
10,66 | 12,24 | 14,68 | 16,92 | 19,68 | 21,7 | 27,9 9 
11,78 |13,44 | 15,99 | 18,31 | 21,2 | 23,2 | 29,6 10 
12,90 | 414,63 | 17,28 | 19,68 | 22,6 | 24,7 | 31,3 11 
14,01 |15,31 | 18,55 | 21,0 | 24,1 | 26,2 | 32,9 12 
15,12 | 46,98 | 19,81 | 22,4 | 25,5 | 27,7 | 34,6 13 
16,22 | 418,15 | 21,1 | 23,7 | 26,9 | 29,1 | 36,1 14 
47,32 | 419,31 | 22,3 | 25,0 | 28,3 | 30,6 | 37,7 15 
18,42 |20,5 | 23,5 | 26,3 | 29,6 | 32,0 | 39,3 16 
19,51 |21,6 | 24,8 | 27,6 | 31,0 | 33,4 | 40,8 17 
20,6 |22,8 | 26,0 | 28,9 | 32,3 | 34,8 | 42,3 18 
21,7 |23,9 | 27,2 | 30,1 | 33,7 | 36,2 | 43,8 19 
22,8 |25,0 | 28,4 | 31,4 | 35,0 | 37,6 | 45,3 20 
23,9 [126,2 | 29,6 | 32,7 | 36,3 | 38,9 | 46,8 21 
24,9 |27,3 | 30,8 | 33,9 | 37,7 | 40,3 | 48,3 22 
26,0 |28,4 | 32,0 | 35,2 | 39,0 | 41,6 | 49,7 23 
27,1 129,6 | 33,2 | 36,4 | 40,3 | 43,0 | 51,2 24 
28,2 |30,7 | 34,4 | 37,7 | 41,7 | 44,3 | 52,6 25 
29,2 |31,8 | 35,6 | 38,9 | 42,9 | 45,6 | 54,1 26 
30,3 132,9 | 36,7 | 40,1 | 44,1 | 47,0 | 55,5 27 
31,4 134,0 | 37,9 | 41,3 | 45,4 | 48,3 | 56,9 28 
32,5 |35,1 | 39,1 | 42,6 | 46,7 | 49,6 | 58,3 29 
33,5 136,2 | 40,3 | 43,8 | 48,0 | 50,9 | 59,7 30 
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t 
Valeurs de ftp satisfaisant à l'égalité 2 ( Sn-1 (€) dt = 
U 
0,1 0,2 0,3 0,4 0,5 0,6 0,7 
n— 1 
1 0,158 | 0,325 | 0,510 | 0,727 | 1,000 | 1,376 1,963 
2 142 289 445 617 | 0,816 | 1,061 1,336 
3 137 277 424 584 765 | 0,978 1,250 
à 134 271 414 269 741 941 1,190 
6) 132 267 408 999 727 920 1,156 
6 131 265 404 553 718 906 1,134 
7 130 263 402 549 711 896 1,119 
8 130 262 399 546 706 889 1,108 
9 129 261 398 543 703 883 1,100 
10 129 260 397 542 700 879 1.093 
11 129 260 396 540 697 876 1,088 
12 128 259 395 539 695 873 1,083 
13 128 259 394 538 694 870 1,079 
14 128 258 393 537 692 868 1,076 
15 128 258 393 536 691 866 1,074 
16 128 258 392 535 690 865 1,071 
17 128 257 392 534 689 863 1.069 
18 127 257 392 5-34 688 862 1,067 
19 127 257 391 933 688 861 1,066 
20 127 257 391 933 687 860 1,064 
21 127 257 391 932 686 859 1,063 
22 127 256 390 532 686 858 1,061 
23 127 256 390 932 685 858 1,060 
24 127 256 590 531 685 857 1,059 
25 127 256 390 531 684 856 1,058 
26 127 256 390 531 684 856 1,058 
27 127 256 389 931 684 855 1.057 
28 127 256 389 530 683 855 1,056 
29 127 256 389 230 683 854 1,055 
30 127 256 389 530 683 S54 1,055 
40 126 255 388 529 681 851 1,050 
60 126 254 387 527 679 848 1.046 
120 126 254 380 526 677 845 1,041 
00 0,126 | 0,253 | 0,385 | 0,524 | 0,674 | 0,842 1,030 
n—1 
0,1 0,2 0,3 0,4 0,5 0,6 0,7 
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Table 6 


Table des legarithmes de base 2 des nombres entiers de 1 à 100 


h 


DS Oo 1 À N = 


| log x | 
SR OP 


2 ,00000 
2,32193 


2,58496 
2,80735 
3,00000 
3,16993 
3,32193 


3,45943 
3,98496 
3,70044 
3,80735 
3,90689 


4 ,00000 
4,08746 
4,16993 
4,24793 
4,32193 


4,39232 
4,45943 
4,52356 
4,58496 
4,64386 


4,70044 
4,75489 
4,80735 
4,85798 
4 ,90689 


4,95420 
9 ,00000 
5,04439 
5,08746 
5,12928 


log x | x 
5,16993 71 
5,20945 72 
5,24793 

73 
5,28540 : 
5,32193 7 

75 
5,35755 
5,39232 76 
5,42626 77 
5,45943 78 
5,49185 =" 
5,52356 80 
5,55459 
5, 58496 81 
5,61471 82 
5, 64386 83 
5,67242 84 
5,70044 85 
5,72792 | 
5,75489 S 
5. 78136 87 
5,80735 > 

80 
5,83289 o 
5,85798 JU 
5,88264 91 
5,90689 = 
5,93074 93 
5,95420 94 
5,97728 de 
6,00000 
6,02237 96 
6.04439 9 
6,06609 98 
6,08746 99 
6,10852 00 


6,12928 


log x 


6,14975 
6,16992 
6,18982 
6,20945 
6,22882 


6,24793 
6,26679 
6,28540 
6,30378 
6,32193 


6,33985 
6,35755 
6,37504 
6,39232 
6,40939 


6,72626 
6,44294 
6,45943 
6,47573 
6,49185 


6,50779 
6,52356 
6,53916 
6,55459 
6,56986 


6,58496 
6,59991 
6,61471 
6,62936 
6,64386 
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Table 7 
Table des valeurs de la fonction n (p)— — p log,p 
ENSLIE 
0 664 | 0,50 0,5000 —46 
0,0664 464 0,51 4954 — 48 
1128 390 0,52 4906 —52 
1518 340 0,53 4854 —54 
1858 303 0,54 4800 —56 
2161 274 0,55 4744 — 59 
2435 251 0,56 4685 —62 
2686 229 0,57 4623 —65 
2915 211 0,58 4558 —67 
3126 196 0,59 4491 —69 
3322 181 0,60 4422 —72 
3503 168 0,61 4350 —74 
3671 155 0,62 4276 —77 
3826 145 0,63 4199 —78 
3971 134 0,64 4121 —81 
4105 125 0,65 4040 — 83 
4230 116 0,66 3957 —8û 
4346 107 0,67 3871 —87 
4453 99 0,68 3784 —90 
4552 92 0,69 3694 —92 
4644 84 0,70 3602 —94 
4728 78 0,71 3508 —96 
4806 71 0,72 3412 —98 
4877 67 0,73 3314 — 99 
4941 59 0,74 3215 — 102 
5000 53 0,75 3113 — 104 
5053 47 0,76 3009 — 106 
5100 42 0,77 2903 —4107 
5142 37 0,78 2796 — 109 
5179 32 0,79 2687 —112 
5211 27 0,80 2575 —113 
5238 22 0,81 2462 —114 
5260 18 0,82 2348 —117 
5278 14 0,83 2231 —119 
5292 9 0,84 2112 —120 
5301 5 0,85 1992 — 121 
5306 1 0,86 1871 —123 
5207 —2 0,87 1748 —125 
5305 —7 0,88 1623 —127 
5298 —10 0,89 1496 —128 
5288 —14 0,90 1368 —130 
5274 ——18 0,91 1238 —131 
5256 —20 0,92 0,1107 —133 
5236 — 24 0,93 0,0974 —135 
5210 —26 0,94 839 —136 
5184 —29 0,95 703 —138 
5153 —33 0,96 565 —139 
5120 —37 0,97 426 — 140 
5083 —40 0,98 286 —142 
5043 —43 0,99 144 —144 
0,5000 1.00 0 
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Table 8 


Valeurs de Pr = ea (répartition de Poisson) 


"| a==0,1 | a=—0,2 | a=0,3 | a=0,4 | a—0,5 | a=—0,6 | a=0,7 | a=—0,8 | a=0,9 
0 | 0,9048 | 0,8187 | 0,7408 | 0,6703 | 0,6065! 0, 5488] 0,4966| 0,4493] 0,4066 
1 110,0905 | 0,1638 | 0,2222 | 0,2681 | 0,3033] 0,3293] 0,3476I 0,3595! 0,3659 
2 110,0045 | 0,0164 | 0,0333 | 0,0536 | 0,0758] 0,09881 0,1217] 0,1438] 0,1647 
3 |10,0002 | 0,0019 | 0,0033 | 0,0072 | 0,0126] 0,0198] 0,02841 0,0383| 0,0494 
4 0,0001 | 0,0002 | 0,0007 | 0,0016] 0,0030| 0,00501! 0,0077] 0,0111 
5 0,0001 | 0,00021! 0,0004! 0,0007! 0,0012] 0,0020 
6 0,0001! 0,0002] 0,0003 
m | a=1 a=2 a=3 Gx=4 a=5 a=6 a=" a—s a-=9 a=1n 


0,0001| 0,0000 


0,3679 | 0,1353 | 0,0498 | 0,0183 | 0,0067| 0,0025| 0,0009| 0,0003 
0,0011] 0,0005 


0 
1 |0,3679 | 0,2707 | 0,1494 | 0,0733 | 0,0337] 0,0149| 0,0064]| 0 ,0027 

2 10,1839 | 0,2707 | 0,2240 | 0,1465 | 0,0842| 0,0446| 0,9223] 0,0107] 0,0050| 0,0023 
3 110,0613 | 0,1804 | 0,2240 | 0,1954 | 0,1404| 0,0892] 0,0521| 0,0286| 0,0150| 0,0076 
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